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(57) Abstract: According to the invention, memories are associated with a reconfigurable component (VPU) at the inputs and out- 
puts thereof, so that the internal data processing and particulariy the reconfiguration cycles can be decoupled from the external data 
streams (to/from periphery, memories etc.). 
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^ geordnet, um eine Entkopplung der intemen Datenverarbeitung und i.b. der Rekonfigurationszyklen von den extemen Datenstr5men 
^ (zu/von Peripherie, Speichem etc) zu erreichen. 
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Titel: Verfahren und Vorrichtungen.zur Datenbe- 

und/oder verarbeitung 

5 Beschreibung 

Die vorliegende Erfindiing.betrifft das oberbegrifflich bean- 
spruchte. Damit befaBt sich die vorliegende Erfindung mit re- 

10 konfigurierbaren Bausteinen im Allgemeinen und hierbei ihsbe- 
sondere, jedoch nicht ausschliefilich mit der Entkopplung der 
Datenverarbeitung innerhalb des rekonfigurierbaren Bausteines 
bzw. innerhalb von Teilen des rekbnfigurierbaren Bausteines 
und Datenstr5inen," und zwar sowohl innerhalb des rekonfigu- 

15 rierbaren Bausteines als auch zu und von Peripherie^ Massen- 
speichern, Hostprozessoren und dergleichen. 
DE 101 10 530-4DE 102 02 044.2 

Einem rekonfigurierbaren Baustein (VPU) werdeh an den Eingan- 
'gen und/oder Ausgangen Speicher zugeordnet, um eine Entkopp- 
20 lung der internen Datenverarbeitung und i.b. der Rekonfigura- 
tionszyklen von den externen Datenstrdmen (zu/von Peripherie, 
Speichern etc) zu erreichen. 

Unter einer rekonfigurierbaren Architektur werden vorliegend 
25 Bausteine (VPU) itiit konf igulrierbarer Funktion und/oder Ver- 
netzung verstanden, insbesqndere integriefte Bausteine mit 
•einer Mehrzahl von ein- oder mehrdimensional angeordneten 
arithmetischen und/oder • logisbhen und/oder analogen und/oder 
speichernden und/oder intern/extern vernetzenden Baugruppen, 
. 30 . die direkt oder durch ein Bussystem miteinander verbunden 
sind. 



bestAtigungskopie 
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Zur Gattung dieser Bausteine zShlen insbesondere systolische 
Arrays, neuronale Netze, Mehrprozessor Systeme, Prozessoren 
mit mehreren Rechenwerken und/oder logischen Zellen und/oder 
kommunikativen/peripheren Zellen (10), Vernetzungs- und Netz- 
5 werkbausteine wie z.B. Crossbar-Schalter, ebensa wie bekannte 
Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. 
Hingewiesen wird insbesondere in diesem Zusammenhang auf die 
folgenden Schutzrechte und Anmeldungen desselben Anmelders: P 
44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, 

10 DE 196 54 846.2-53, DE 196 54 593-5-53, DE 197 04 044.6-53, 
DE 198 80 129.7, DE 198 61 088 .2-53, --DE 199 80-312.9, 
PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 
DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, 
EP 01 102 674,7, DE 196 51 075.9, DE 196 54 846.2, DE 196 54 

15 593.5,. DE 197 04 728.9, DE 198 07 872.2, DE 101 39 170.6, DE 
199 26 538.0, DE 101 42 904.5, DE 101 10 530.4, DE 102 02 
044.2, DE 102 06 857.7, DE 101 35-210.7, EP 02 001 331.4, EP 
01 129 923.7 sowie die jeweiligen Parallelanmeldungen hierzu. 
Diese sind allesamt hiermit zu Of fenbarungszwecken vollam- 

20 fanglich eingegliedert . 

Die o-g. Architektur wird beispielhaft zur Verdeutlichung 
herangezogen und im folgenden VPU genannt. Die Architektur 
besteht aus beliebigen arithmetischenp. logischen (auch Spei- 

25 Cher) und/oder Speicher zellen und/oder Vernetzungszellen 

und/oder koitimunikativen/peripheren (10) Zellen (PAEs) , die zu 
einer ein- oder mehrdimensionalen Matrix (PA) angeordnet sein 
kSnnen, wobei die Matrix unterschiedliche beliebig ausgestal- 
tete Zellen aufweisen kann,. auch. die Bussysteme werden dabei 

30 als Zellen verstanden. Der Matrix' als' ganzes oder Teilen da- 
von zugeordnet ist eine Konf igurationseinheit (CT) ,. die die 
Vernetziang und Funktion des PA beeinflufit.. 
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Speicherzugriffsverfahren fQr rekonfigurierbare Bausteine/ 
die nach einem DMA-Prinzip arbeiten sind aus P 44 16 881.0 
bekannt, wobei eine oder mehrere DMAs dabei durch Konfigura- 
5 tion entstehen. In DE 196 54 595.1 sind DMAs fest in die In- 
terface-Baugruppen implementiert und k5nnen durch das PA oder 
die CT angesteuert werden. 

In DE 196 54 846.2 ist das Beschreiben von internen S'peichern 
. durch externe Datenstrome und das Wiederauslesen der Spei- 

10 cherdaten an externe Einheiten beschrieben. 

DE 199 26*538.0 beschreibt erweiterte- Speicherkonzepte ent- 
sprechend DE 196 54 846.2, urn eine einfacher zu programraie- 
rende und leistungsfahigere Dateniibertragung zu erreichen. 
In US 6,347,346 wird ein Speichersystem beschrieben, das in 

15 alien wesentlichen Punkten DE.196 54 846.2 entspricht, wobei 
es einen expliziten Bus (global system port) zu einem globa- 
len Speicher aufweist. Es beschreibt US6,341,318 ein Verfah- 
ren zum Entkoppeln von externen Datenstromen von der internen 
Datenverarbeitung derart, dass ein Double-Buffer Verfahren 

'20 verwendet wird, wobei jeweils ein Buffer die externen Daten 
aufnimmt/ausliest, wahrend ein anderer die internen Daten 
aufnimmt/ausliest; sobald die Buffer entsprechend ihrer Funk- 
tion voll/leer sind, werden die Buffer umgeschaltet, d.h- der 
vormals fur die internen Daten zustanciige Buffer leitet nun- 

25 mehr seineDaten an die Peripherie bzw. (liest neue Daten von 
der Peripherie) , und die vormals fur die externen\Daten zu- 
standige leiten nunmehr ihre Daten an das PA. (lesen neue Da- 
ten von dem PA) - Die Double-Buffer sind derart in -der Appli- 
kation verwendet, dass sie einen zusammenhangenden Datenbe- 

30 reich buffern. . 
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Perartige Doppelpufferanordnungen haben massive Nachteile 
insbesondere im Datenstrombereich, d.h. beim sogenannten Da- 
tastreaming/ in welchem groBe Mengen an sukzessive in ein 
Prozessorfeld Oder dergleichen einstr5menden Daten auf immer 
5 wieder gleiche Weise bearbeitet werden massen. 

Aufgabe der Erfindung istes, Neues far die gewerbliche Nut- 
zung bereitzustellen.- 

10 .Die Losung der Aufgabe wird unabhangig beansprucht. Bevorzug- 
te Ausfuhrungsformen befinden sich in den UnteransprUchen, 

Das erfindungsgemafie Verfahren erlaubt. somit im Gegensatz zu 
dem vorbekarinten, gerade im Kembereich typischer Anwendungeri 

15 von rekonfigurierbaren Prozessoren nachteiligen Stand der 
Technik eine wesentlich einf achere . Kontrolle der Buffer bzw. 
zwischengeschalteten Speicher. Externe and interne Bussysteme 
konnen aufgrund der zwischengeschalteten Speichenoittel pro- 
blemfrei mit unterschiedlichen Transfer- bzw. Obertragungsra- 

20 ten und/oder Taktf requenzen betrieben/werden^ weil -durch die 

■ " Buffer Daten zwischengespeichert werden. Es werden im Ver- 

■ ' gleich zu schlechteren ^Losuagen aus deiri Stand der Technik we- 
■ niger Speichermittei, typisch nur halb so viele Buffer bzw. 

. Datentransferschnittstellenspeichermit;tel benotigt, wobei 
25 sich die Hardwarekosten massiv reduzieren; Schatzungen der 
Hardwarekostenreduktion belaufen sich auf 25% bis 50'%. Auch 
ist es einfacher, Adressen zu- generieren und die Anordhung zu 
programmieren, da die- Buffer fur den Programmierer transpa- 
rent sind. Die Hardware ist einfacher zu beschreiben und ist 
30- zu debuggen. . 
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Ein Paging-Verfahren kann integriert werden, das verschiedene 
Datenbereiche insbesondere ftir verschiedene Konfigurationen 
buffert. 

5 

Es sei zunachst darauf hingewiesen^ daB verschiedene Spei- 
chersy Sterne als Schnitts telle (Interface) zur 10 bekannt 
sihd. Verwiesen wird auf P 44 16 881.0, DE 196 54 595.1, DE 
199 26 538.0. Weiterhin ist aus DE 196 54 846.2 ein Verfahren 

ID bekannt, bei dem zunachst Daten von der 10 geladen werden, 
(1) Daten nach deren Berechnung innerhalb eiher VPO gespei- 
chert werden , (2) das Array (PA) umkonf iguriert wird, {3) die 
Daten aus dem internen Speicher ausgelesen werden und wieder 
in einen anderen internen Speicher geschrieben werden, (4) so 

15 lange, bis das vollstandig berechnete Ergebnis an die 10 ge- 
sendet wird. Urn- bzw. Rekonfiguration bedeutet, dass bei- 
spielsweise eine von einem Teil des Feldes rekonfigurierbarer 
Einheiten oder dem Gesamtfeld ausgefUhrte Funktion und/oder 
■ die* Datenvernetziing und/oder Daten und/oder Konstanten, die 

20 bei der Datenverarbeitung erforderlich sirid, neu .bestimmt 
• werden. Je nach Anwendung und/oder. Ausgestaltung werden VPUs 
beispielsweise nur komplett oder auch partiell rekonfigu- 
riert. Unterschiedliche Re konfigurations verfahren sind iinple- 
mentlerbar, z.B, kompiette Rekonfiguration durch Umschalten. 
• 25. von SpeicHerbereichen DE 196 51 075. 9, DE 196 54 846.2 

und/oder WaveReconfiguration (DE 198 07 872.2, DE 199 26 
53'8.0, DE, 100, 28 397.7, ;DE 102 0-6. 857.7.) und/oder einf aches 
konfigurieren adressierbarer Konfigurations speicher (DE 196 
•51 07-5. 9,- DE 196 54 846. 2>. DE 196 54 593.5)'. Die jeweiligen 
: 30 Schrif ten werden zu Of f enbarungszwecken vollumf anglich einge- 
gliedert. " ' 
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In einer bevorzugten Ausgestaltung ist eine VPO gesamt Oder 
partiell mittels eine WaveRekonfiguration Oder dem direkten 
setzen von adressierbarer. Konfigurationsspeicher konfigurier- 
bar. 

5 

Es besteht somit eines der wesentlichen Arbeitsprinzipien der 
VPU-Bausteine darin, Daten zwischen mehreren Speichern hin 
und her zu kopieren, wobel wShrend jedes Kopiervorganges zu- 
satzliche und ggf. dieselben (z.B. langer FIR-Filter) 
10 und/oder andere (z.B. FFT gefolgt von Viterbi) Operationen 
Ober den Daten durchgefuhrt werden. Abhangig von der j^weili- 
gen Applikation werden die Daten aus einem oder mehreren 
Speichern gelesen und in einen oder mehrere Speicher ge- 
schreiben. 

15 

ZmcL Speichern von DateristrSmen und/oder ZustSnden (Trigger, 
vgl. DB 197 .04 728.9, .DE 199 26 538 ,0) werden inteme/externe 
Speicher (z.B, als FIFOs) verwendet und entsprechende Adress- 
. generatoren eingesetzt. Jede sinnvolle Speicherarchitektur 
20* kanh algorithmenspezifisch fest implementiert und/oder flexi- 
bel kpnfiguriert werdeh/sein. 

Vorzugsweise werden aus-.Perfbrinancegfunden* die ihterhen Spei- 
cher der VPU verwendet, grundsatzlich sind auch externe Spei- 
■ cher verwendbar. 
25 • 

Dies voraiigestellt/ sei nunmehr zum prinzipiellen Aufbau fol- 
gendes ang.emefkt*':. ♦ - 

Eineiri Array (WA) werden Interf ace-Baugruppen. zugeordnet, die 
30 Daten zwischen den Bussystemen des PA. und externen Einheiten 
■koinmunizieren- (vgl. P 44 16 881. 0,. DE 196 5'4 595.1). Die In- 
terface-Baugruppen verknQpfen Adressbusse und Datenbusse der- 
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art, dass eine feste Zuordniing zwischen Adressen und Daten 
entsteht. Bevorzugt kSnnen Interface-Baugruppen selbstandig 
Adressen Oder Telle von Adressen generieren. 
Den Interface-Baugruppen werden FIFOs zugeordnet, die die In- 
5 terne Datenverarbeitung von der. externen DatenObertragung 
entkoppeln. Eln FIFO stellt hler ein datendurchstrSinbares 
Puffer- bzw. Eingangs-ZAusgangsdatenspeichermlttel dar, das 
zur Datenverarbeitung insbesondere wahrend des AusfOhrens ein 
und derselben Konfiguration nicht umgeschaltet werden mufl. 

10 Soweit neben FIFO-Speichem andere- datendurchstrGitibaxe Puf- 
fermittel bekannt* sind, werden .diese na'chf olgend. glelchfalls 
als von dem Begriff umfafit sein, wo anwendbar. ErwShnt seien 
insbesondere Ringspeicher mlt einem oder mehreren Zeigern, 
insbesondere wenigstens einem Schreib- und einem Lesespei- 

15 Cher. Somit kann beispielsweise wahrend mehrerer Rekonfigura- 
tionszyklen zur Abarbeitung einer Applikation der externe Da- 
tenstrom weitgehend konstant aufrecht erhalten werden, unab- 
hangig von den intemen Verarbeitungszyklen. Die FIFOs konnen 
elngehende/ausgehende Daten und/oder Adressen speichern. Die 

20 FIFOs konnen in eine Interface-Baugruppe integriert oder die- 
ser Oder mehreren dieser zugeordnet werden. Es konnen je nach 
Ausg'eistaltung auch FIFOs' in den Ihterfacebaugruppen inte- 
griert jsein- und gleichzeitig zusatzliche separate implemen- 
tiert seih'. Auch sind datendurchstromi?are Puffermittel mog- 

25 lich, die integriert. ndt dem Baustein sind, beispielsweise 
durch Integration' von FIFO-Grupen auf einem eine rekonf igu- 
rierbare: Prozessoranordnting bildenden Chip-. 

Zwischen den (auch separaten> FIFO's und den Interface- 
30 Baugrupperi konnen in einer moglichen Ausgestaltung Multiple- 
xer zur freien Zuordnung von Interface-Baugruppen und .FIFOs 
vorhanden* sein. Die- von einem Multiplexer jeweils einge'nomme- 
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ne ZUschaltung von FIFOs zu externen Baugruppen oder internen 
Teilen des Prozessorfeldes kann in einer bevorzugten Anord- 
nung aus dem Erozessorfeld heraus vorgegeben werden, bei- 
spielsweise von der datensendenden und/oder -empfangenden 
5 PAE, ist aber auch, sollte dies gewiinscht sein, von einer 
hierarchisch ubergeordneten Einheit bestimrabar, wie eiriem 
Hostprozessor im Fall der Aufteilung der Datenverarbeitung in 
einen hochparallelen und einen schlecht parallelisierbaren 
Aufgabenanteil und/oder es ist- laSglich^ die Multiplexer- 
10 Schaltung durch externe' Vorgaben zu bestiinmen, was sinnvoll 
sein kann, wenn mit den Daten- etwa angegeben wird, um" welche 
Art von Daten es sich handelt und wie sie zu verarbeiten 
sind. 

.Seitens des externen Anschlusses sind Einheiten zur Proto- 
15 kollkonvertierung zwischen den internen und den externen Bus- 
protokollen (z.B. RAMBUS, AMBA, PCI, etc) vorgesehen. Mehrere 
unterschiediiche Protokollkonverter konnen innerhalb einer 
Auagestaitung verwendet werden. Die Protokollkonverter k5nnen 
. separat ausgestaltet sein oder in die FIFOs oder in die In- 
20 terface-Baugruppen integriert sein. 

Zwischen den {separated) Protokollkonveirtern und den Inter- 
* face-Baugruppen/ FIFOs kanneh in einer m5giichen Ausgestaltung 
Multiplexer zur freien Zuordnuhg von Interface- 
Baugruppen/ FIFOs und Protokollkonvert^n vorhanden sein. 
25 Den Protokollkonve.rtern nachgeschaltet kann sich eine weitere 
Multiplexerstufe bef inden, wodurch. beispielsweise mehrere AM- 
BA-Businterface auf denselben AMBA-Bus auf geschaltet sein - 
konnen.. Dies e Multiplexerstufe kann beispielsweise auch- durch 
die Eigenschaft . e'ines externen .Busses entstehen, mehrere Ein- 
.'30 heiten adressieren zu konnen. 
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In einer bevorzugten AusfOhrung arbeitet die Schaltung in ei- 
nem Master und einem Slave Betriebsmodus . Im Mastermodus wer- 
den die Adressen und Buszugriffe durch die Schaltung und/oder 
das zugeordnete PA generiert, im Slavemodus wird von externen 
5 Einheiten auf die Schaltung bzw. das PA zugegriffen. 

In weiteren Ausgestaltungen kdnnen innerhalb der Schaltung 
applikationsabhangig zusStzliche Pufferspeicher Oder Daten- 
• sammelspeicher (Collector) zum Datpnaustausch zvrischen den 

10 Interface-Baugruppen vorgesehen sein, Diese Pufferspeicher 
. arbeiten bevorzugt. in einem Random-Access- ..und/oder MMU- 
Paging- und/oder Stack-Modus und kSnnen .eigene Adressgenera- 
toren aufweiseh. Die Pufferspeicher sind bevorzugt als Multi- 
Port Speicher ausgestaltet, um den gleichzeitigen Zugriff 

15 mehrerer Interf ace-Bauguppen zu ermoglichen. Auf die Puffer- 
speicher kann von einer ubergeordneten Datenverarbeitungsein- 
heit insbesondere von dem rekonf igurierbaren Baustein (VPU) 
zugeordneten Prozessoren wie DSPs, CPUs, Mikrokontroller etc. 
zugegriffen werden. 

20 

Es sei nun angegeben^ wie auf besondere Weise externe Daten- 
strome ^entkoppelt werden koiinen. Gemafi' . einem- wesentlichen 
Aspekt der Erf indung werden die externen Datenstrome durch 
FIFOs (Input-/Output-FIFO, zusammenge^afi^t lO-FIFO) , die zwi- 
25 scheh der Protokollkonvertern und- den Interface-Baugruppen 
■eingesetzt sind, entkoppelt- 

Das Datenverarbeltungsverfahren funktioniert wie folgt: 
Durch 'einen dder raehrere Input-FIFO werden die .eingehenden 
Daten von der Datenverarbeitung. im Array- (PA), entkoppelt, 
. 30 D±e Datenverarbeitung kann in folgenden Schritten- effolgen: 
!• Das /die Input- FIFO wird/werden. aiisgelesen, vom Array 
(PA) verarbeitet und/oder in einen oder mehrere (ande- 
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re) , lokal dem Array zugeordneten und>|foder bevorzugt 
seitliche an das Array gekoppelten Speicher (RAM-Bankl) 
geschrieben. Die seitliche. Ankopplung hat den Vorteil, 
dafl sich die Chiparchitektur und/oder deren Entwurf ver- 
5 einfacht. 

2* Das Array (PA) wird umkonfiguriert. Die Speicher (z.B. 
RAM-Bankl) werden ausgelesen, die Daten werden verarbei- 
tet und in einen oider mehrere Speicher (z,B, RAM-Bank2 
und/oder RAM-Bankl) oder altemativ bereits an die Out- 
10 put-FIFOs gemafl Schritt 4 geschrieben. 

3. Das Array (PA) wird wieder mtikonf iguriert und die Daten 
werden vrieder in ein Speicher geschrieben- 

4. Dies setzt sich so lange fort, bis das Ergebnis an einen 
Oder mehrere Output-FIFO zum Ausgang gesendet. wird- 

15 : 5. Danach werden wieder neue Daten von dem/den Input-FIFO 

ausgelesen und entsprechend verarbeitet, d.h. die Daten- 
verabeitung wird bei Schritt 1 fortgesetzt, 

Durch die bevorzugte Ausbildung der Input-/Output-FIFOs (.10- 
20 FIFOs) als multi-ported FIFOs kann die Datenverarbeitung da- 
bei zeitgleich mit dem Einschreiben bzw. Auslesen der jewel- . 
ligen FIFOs durch die Protokollkonverter erfolgen. 
Durch die vorstehend beschriebene Weise entsteht eine zeitli- 
che Entkopplung, die die „quasistationare^^ Verarbeitung von 
25 konstanten DatenstrSmen derart ermoglichtv dafi lediglich noch 
eine.Latenz, aber keine Unterbrechung^ des Datenstromes mehr 
auftritt, wenn die ersten Dateripakete durchgelaufen sind. 
In eiher erweiterten Ausgestaltung. konnen die lO-FIFOs derart 
aufgebaut sein, da3s entsprechend der -Applikation- die Anzahl 
30 der lO-FlPOs und deren Tiefe gewShlt . werderi kann. Mit arideren 
Worten konnen lO-FIFOs (z.b* uber Transmission Gate,. Multi- 
plexer /Deraultioplexer etc) zerteilt oder zusainmengef aBt wer- 



wo 02/071248 



PCT/EP02/02398 



derir sodass mehr oder tiefere lO-FIFOs entstehen. Beispiels- 
weise konnen 8 FIFOs zu je 1024 Worten implementiert sein, 
die derart konfigurlert werden, dass entweder 8 FIFOs A 1024 
Worte Oder 2 FIFOs & 4096 Worte oder z,B. 1 FIFO mit 4096 
5 Worten und 4 mit 1024 Worten konfiguriert sind. 

Je nach Ausgestaltung des Systems und Anforderungen der Algo- 
rithmen sind Modif ikationen des beschriebenen Datenverarbei- 
tungsverfahrens moglich. 

10 In einer erweiterten Ausgestaltung arbeiten die FIFOs derart/ 
dass bei Output-FIFOs aiich' die zu den Dateneintrfigen gehdren- 
den Adressen in den FIFOs gespeichert werden und/oder Input- 
FIFOs derart aufgebaut sind, dass jeweils ein FIFO f (ir die 
auszusendende/ausgesendete Leseadressen und ein FIFO fiir die 

15 eingehenden den Adressen zugeordneten Datenworte existiert. 

Es sei nun diskutiert, wie eine erfindunqsqemcLfi mdgliche. FI- 
FO-RAM-Bank Kopplunq in einer besonders bevorzuqten Variante 
der Erfindung erfolgen kann, 

20 

Je nach Applikation ist es moglich/ den Datentransfer mit den 
lO-FIFOs iiber eine oder mehrere weitere^ -lokal dem Array zii- 
geordnete oder bevprzugt seitlieh an das Array gekoppeite, 
Speicherstufe(n) (RAM-Bank) zu fiLihren..^und erst dann an die 
25 datenverarbeitenden PAEs (z.'fi. ALU- PAEs nach DE 196 51 075,9) 
wei ter zuleiten . 

. In einer bevorzugten Ausgestaltiang weisen RAM-PAEs mehrere 
Daten- und Adressinterf aces, auf , sind. also als multiport- 
Anordnungen ausgebildet. Di^ Ausgestaltbarkeit.-eines Daten--. 
30 und/oder Adressinterf aces als.globaien Systemport sei als 
mGglich erwahnt- . 
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Die zusatzliche Speicherstufe(n) (RAM-Bank) kdnnen beispiels- 
weise durch Speicherbaugruppen entsprechend den RAM-PAEs nach 
■ DE 196 54 846.2 und/oder DE 199 26 538^0 und/oder PCT/EP 
00/10516 realisiert sein. 
5 Mit anderen Worteh kann eine RAM-PAE einen passiven (im we- 
sentllchen) auf die Spelcherfunktion beschrclnkten Spelcher 
(siehe DE 196 54 846.2) Oder aber einen aktiven Speicher, der 
Funktionen wie z.B. Adressberechnung und/oder Buszugriffe 
selbstSLndig generiert und steuert (siehe DE 199 26 538.0) 

10 darstellen. Insbesondere k5nnen in einer mQglichen Ausgestal- 
tung auch aktive Adressgenerierungsfianktionen und/bder Daten- 
transferfunktionen fUr einen 'global system port' implemen- 
tiert sein. Aktive Speicher konnen je nach Ausgestaltung ei- 
nen Oder mehrere Daten- und Adressinterface aktiv (aktive In- 

15 terface) verwalten. Aktive Interface konnen beispielsweise 
durch zusatzliche Baugruppen wie beispielsweise Sequen- 
zer/Zustandsmaschinen und/oder ALUs und/oder Register, etc., 
innerhalb einer RAM-PAE realisiert sein und/oder durch die 
'geeignete Verschaltung eines aktiven Interfaces mit anderen 

20 PAEs erfolgen, deren Funktion und Vernetzung entsprechend der 
zu realisierenden Funktionen in einer oder mehrerer . RAM-PAEs 
. konfiguriert. Unterschiedlichen RAM-PAEs konnen unterschied- 
liche andere PAEs zugeordnet werden. 

.25. RAM-PAEs weisen bevorzugt eine oder mehrere der folgende^ 
Funktionen bzw. Betriebsarten auf: random access, FIFO, ' 
Stack, Cache, MMU-paging. RAM-PAEs sxnd in einer bevorzugten 
Ausgestaltung uber einen Bus mit einer libergeordneten; Konfi- 
gurationseinheit (CT) verbunden und kOnnen durch diese in ih- 

.30 * rer Funktion und/oder Vernetzung und/oder • Speichertiefe . 

und/oder Betriebsart konfiguriert- werden. Weiterhin besteht 
bevorzugt die Moglichkeit, Speicherinhalte durch die CT.vor- 
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zuladen und auszulesen, z.B. um Konstante und/oder Lookup- 
Tabellen (cos/sin) zu setzen. 

Durch die Verwendung von multi-ported Speichern fdr die RflM- 
5 PAEs kann das Einschreiben bzw. Auslesen von Daten von/zu den 
10- FIFOs und der Datenzugriff durch das Array (PA) zeitgleich 
erfolgen, sodass die RAM-PAEs ihrerseits wiederum eine Puf- 
' f er-Eigenschaf t aufweisen konnen, wie beispielsweise in DE 
196 54 846.2 aufgezeigt. 

10 

RAM-PAEs konnen, wie beispielsweise in PCT/EP 00/10516 darge- 
stellt, derart zusaramengefasst warden^ dass grossere Spei- 
cherbldcke entstehen bzw. dass die RAM-PAEs derart arbeiten, 
dass die Funktion eines grofieren Speichers entsteht (z.B. aus 
15 2 512 Wort RAM-PAEs ein 1024 Wort RAM-PAE) . 

In einer mdglichen Ausfuhrung kann die Zusammenfassung derart. 
erfolgen, dass an mehrere Speicher dleselbe Adresse gefUhrt 
wird-. Die Adresse wird derart .unterteilt^ dass ein .Teil die • 

20 Eintrage in den Speichern adressiert und ein anderer Teil die 
Nuramer des selektierten Speichers, (SEL) angibt. Jeder Spei- 
cher besitzt eine eihdeutige Nummer und kann durch eihen Ver- • 
gleich derer mit SEL eindeutig selektiert werden kann. In ei- 
ner bevorzugten Ausf.uhrung ist die Nummer fiir jeden Speicher 

25 konfigurierbar. 

In einer weiteren und/oder zusatzlichen' moglichen Ausfiihrung 
wird eine- Adresse von einem. Speicher zum' Nachsten weiterge- 
, leitet wird. Die Adresse wird derart untertjeilt, dass ein 
' . 30 Teil die Eintrage in den Speichern adressiert und ein^ anderer 
Teil die Nummer .(SEL) des selektierten Speichers angibt. Die- 
se wird bei jeder Weiterleitung modifiziert, beispielsweise 
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kann dieser bei jeder Weiterleitung eine l^subtrahiert wer- 
den. Der Speicher bei dem dieser Adressteil einen bestinmten 
Wert aufweist (z.B. Null) > wird aktiviert. 

5 In einer moglichen Ausfuhriing kann die Zusainmenf assung derart - 
erfolgenr dass an mehrere Speicher dieselbe Adresse gefiihrt 
wird. Die Adresse wird derart unterteilt, dass ein Teil die 
EintrSge in den Speichern adressiert und ein anderer Teil die 
Nummer' (SEL) des selektierten Speichers angibt. Zwischen den 

10 Speichern verlSuft ein Bus von jeweils einem Speicher zum 
• Nachstenr der eine Referenzadresse derart aufweist, dass die- 
se bei dem eirsten Speicher einen bestimmten Wert aufweist 
(z.B. null) und dieser bei jeder Weiterleitung modifiziert 
wird (z.B, wird eine 1 aufaddiert) . Dadurch besitzt jeder 

15 Speicher eine andere eindeutige Referenzadresse- Der Teil der 
Adresse, die die Nummer des selektierten Speichers aufweist, 
wird jeweils mit der Referenzadresse vergli-chen. Bei Gleich- 
heit ist der betreffende Speicher selektiert- Je nach Ausge- 
staltung kann der Referenzbus liber das gew5hnliche Datenbus- 

20 system oder tiber einen separierten Bus aufgebaut sein. 

^•In einer mffglichen Ausfuhrtihg kann jeweils eine Bereichsuber- 
prtifung des Adressteils SEL erfolgen, um Fehladressierungen 
auszuschlieBen. 
25 ' 

Es sei nun darauf hingewiesen,. daii es mpglich ist, die RAM-- 
PAEs als FIFOs -zu benutzen. Dies kann besonders bevorzugt 
sein, wenh eine vergleichsweise groBe Speicherkapazitat durch 
RAM- PAEs vorgesehen wird. Es entsteht somit besonderg iinter 
„ 30 Ausnutzung von multi-ported Speichern fiir die RAM-PAEs die 

Ausgestaltungsmoglichkeit,. auf .expliz-ite lO-FIFOs zu verzich-- 
ten und/bder .zusatzlich zu den lO^-FIFOs eine entsprechende 
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Anzahl PAE-RAMs als FIFO zu konf igurieren und die Daten der 
10 an die entsprechenden Ports der Speicher zu fClhren. Diese 
Ausgestaltung kann als besonders kosteneffizient angesehen 
werden, da keinerlei zuscltzlichen Speicher vorgesehen warden 
5 miissen, sondem die in ihrer Funktion und/oder Vernetzung 

konfigurierbaren Speicher der VPU Architektur (vgl, DE 196 54 
846.2, DE 199 26 538.0, PCT/EP 00/10516) entsprechend des 
Charakters konfigurierfaarer Prozessoren konfiguriert werden. 

ro Es ist weiter moglich, einen Multiplexer/Demultiplexer vor 
und/oder nach dem FIFO vorzusehen. Eingehende bzw. ausgehende 
Datenstrome kQnnen aus eineia Datensatz oder mehreren Daten- 
satzen entstehen, Beispielsweise benotigt die Funktion 



15 . function example (a, b : integer) -> x : integer 
for i:= 1 to 100 
for j := 1 to 100- 
x[i] := a[i] * b[j] 

20 zwei eingehende Datenstrdme (a und b) und einen ausgehenden 
Datenstrom (x) . * 
•Die Anforderung kann z.B. durch zwei AnsStze erfullt werden: 

a) Es werden exakt so viele lO-KanSle implementiert, wie Da- 
tenstrome erforderlich isind (vgl. P 44 16 881.0, DE 196 54 

25 595,1); in der beispielsweise angegebenen Funktion waren also 
• bereits drei I/O-Kanale erforderlich; oder 

b) Durch die Verwendung von internen Speichern zur. Entkopp- 
lung der Datenstrome, quasi als. Registersatz (vgl. DE 199 26 
538.0, DE 196 54' 846.2) . Die unterschiedlichen Datenstrome 

30- werden Z..B. durch ein Zeitmultiplexverfahren zwischen einem 
Oder mehrere Speichern und der 10 (.z.B-. Speicher, Peripherie,, 
etc) ausgetauscht. Intern .konnen die Dateii dann ggf . parallel 
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mit mehreren Speicher ausgetauscht werden, ^sofern die 10- 
Daten beim Transfer zwischen diesen Speichem und der 10 ent- 
sprechend sortiert (gesplittet) werden. . 

5 Der Ansatz a) wird erfindungsgemafi dadurch unterstatzt, dass 
eine ausreichende Anzahl von lO-KanSilen und lO-FIFOs zur Ver- 
fiigung gestellt wird. Allerdings ist dieser einfache Ansatz 
unbefriedigend, da eine nicht exakt bestimmbare, algorithmen- 
abhange und zudem sehr kostenaufwendige Anzahl von lO-Kanaien 
10 zur Verfxigung gestellt werden muB. - 

Daher ist der Ansatz b) Oder eine geeignete Mischung aus a) 
und b) vorzuziehenr z,B. 2 lO-Kanale, ein Input und ein Out- 
put, wobei auf jedem Kanal die Datenstrome ggf • gemultiplext 

15 werden. Es sei darauf hingewiesen, daB einleuchtenderweise 
die Schnittstellen in der Lage sein mussen, die DatenstrCme 
zu bearbeiten, also eine hinreichend hohe Taktfrequenz 
und/oder hinreichend niedrige Latenzzeiten auf den interrien 
bzw, externen Bussen vorgesehen werden massen. Dies kann der 

20 Grund sein, warum eine Mischung beider Varianten besonders 
bevorzugt ist, well durch Vorsehen mehrerer paralleler I/O- 
Kanale die erforderliche Taktungder externen und/oder inter-. 
nen Busse entsprechend herabsetzbar ist. 

25. FUr Ansatz b)" bzw. Ansatze, in denen zumindest partiell auf 
. Ansatz b) zuriickgegrif fen wird, ist es erforderlich Multiple- 
xer bzw.. Demultiplexer vorzusehen und die Datenstr5me von ei- 
nem Datenkanal aufzutrenneh (z.B.. aiis dem Input -Kanal muB a 
. urid b abgetrennt werden) oder mehrere Ergebhiskanale auf ei- 
30 nen Outpu-t-Kanal zusammenzufuhren. - 
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Hierzu kc3nnen ein oder mehrere Multiplexer/Demultiplexer 
(MuxDemux-Stufe) an verschiedenen Positionen angeordnet wer- 
den, abh^ngig von der hardwaretechnischen Realisierung bzw. 
den auszuftihrenden Funktionen. Zum Beisplel kann 
5 a) eine MuxDemux-Stufe zwischen Input-/Output-Interface (z.B. 
nach DE 196 54 595.1) und der FIFO-Stufe (lO-FIFO und/oder 
PAE-RAM als FIFO) 

b) eine MuxDemiix-Stufe nach der FIFO-Stufe (lO-FIFO und/oder 
PAE-RAM als FIFO), also zwischen FIFO-Stufe und PA 
10 c) eine MuxDemux-Stufe zwischen 10- FIFO und RAM-PAEs 
geschaltet werden. 

Die MuxDemux-Stufe kann ihrerseits entweder in Hardware fest 
implementiert werden und/oder durch die geeignete Konf igura- 
15 tion von beliebigen entsprechend ausgebildeten PAEs entste- . 
hen. 

Die Stellung der Multiplexer/Demultiplexer der MuxDemux-Stufe 
wird von der Konfiguration durch eine CT und/oder dem Array 
(PA) und/oder der 10 selbst vorgegeben, wobei diese auch dy- 
20- namisch, z.B. anhand des Fiillgrades des/der FIFOs und/oder 
anhand anstehender Datentransf ers (Arbitrierung) beeinf lufit 
werden kann. 

In einer bevoirzugten Ausgestaltung wii;4 die Multiple-. 
25 xer /Demultiplexer Struktur durch ein konfigurierbares Bussy- 
stem ausgebildet (z.B. entsprechend oder ahnlich dem. Bussy- 
stems zwischen den (RAM/ALU/etc-PAEs) , wobei das Bussystem 
insbesondere' auch physikalisch dasselbe sein kann^ das entwe- 
der durch Ressourceh-Sharing oder ein Zeitmultiplex- 
. 30 Verfahren, das durch geeignete Rekonf iguration realisiert 
werden kann, mitbenutzt wird. 
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Besonders bevorzugt ist es, wenn Adressen auf eine besondere 
Art und Weise generiert werden^ wie sich diese aus dem Nach- 
.folgenden erschlieflt. Adressen fUr interne oder externe Spei- 
Cher kOnnen durch Adressgeneratoren berechnet werden. Bei- 

5 splelsweise konnen Gruppen von PAEs entsprechend konfiguriert 
werden und/ oder explizite und ggf- gesondert und speziell im- 
plementlerte Adressgeneratoren (z.B.. DMA wie aus DE 44 16 881 
bekannt oder innerhalb von • Interf ace-Zellen (wie aus DE 196 
54 -595.1 bekannt) eingesetzt werden. Mit anderen Worten. k5n- 

10 nen entweder fest implementierte Adressgeneratoren die in ei- 
ner VPU integriert sind oder extern realisiert sind^ verwen- 
det werden^ und/oder die Adressen durch eine Konfiguration 
von PAEs entsprechend den Anforderungen eines Algorithmus be- 
rechnet werden. 

15 

Vorzugsweise konnen einfache Adressgeneratoren fest in den 
Inter face-Baugruppen und/oder aktiven Speicher (z.B. RAM- 
PAEs) implement iert seih. Zur Generierung komplexer Adressse- 
quenzen (z.b. nicht linear, multidimensional etc) k5nnen PAEs 
20 entsprechend konfiguriert und mit den Interface-Zellen ver- 
bunden werden. Derartige Verfahren mit den entsprechenden 
' Konfigurationen sind aus PCT/EP 00/10516 bekannt. 

Korif igurierte Adressgeneratoren konnen, einer anderen Konf igu- 
25 ration (Config-ID, vgl. DE 198 07 872.2',. DE 199 26 538.0, DE 
100 28 397.7) als die Dat^nverarbeitung angehoren. Damit ist 
eine Entkopplung der Adressgenerierung von der Datenverarbei- 
' tung moglich, womit in einem bevorzugten Arbeitsverfahren 
heispielsweise Adressen bereits generiert und die entspre- 
. 30 chenden Daten bereits geladen werden konnen, bevor. oder wah- 
rend die datenverarbeitenden Konfiguration konfiguriert wird. 
DaB ein solches Datenvorladen bzw. Adressvorgenerieren z.ur 
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Erh5hung der Prozesaorleistung^ insbesondere durch Latenz- 
zeit- und/oder Wartetaktzyklusverringerung besonders bevor- 
zugt ist, sei erwahnt. Entsprechend lc6nnen Ergebnisdaten und 
deren Adressen noch bearbeitet werden, wShrend oder nachdem 
5 die datenverarbeitendeZ-generierende Konfiguration entfernt 
wlrd. Insbesondere ist es mdglichr durch den Einsatz von 
Speichern und/oder Puffern wie z.B. die beschriebenen FIFOs 
die Datenverarbeitung weiter von den Speicher- und/oder 10- 
Zugriffen zu entkoppeln, 

10 

Besonders leistungsfShig ist in einer tevorzugten Arbeitswei- 
se eine Zusammenschaltung von fest implementierten Adressge-. 
neratoren (HARD-AG) (DE 196 54 595.1) und konf igurierbaren 
Adressgeneratoreh im PA (SOFT-AG) derart, dass fur die Reali- 
15 sierung einfacher Adres.sierungsschematas die HARD-AG verwen- . 
det warden und komplizierte Adressierungsablaufe durch die 
SOFT-AG berechnet und dann an die HARD-AG geleitet werden. 
Mit anderen Worten konnen die einzelnen Adressgeneratoren 
sich gegenseitig iiberladen und neu setzen. 

,20 

Interface^Baugruppen fur rekontigurierbare Bausteine werden- 
bereits DE 196 54 595.1 offenbart- Es wurde gefunden, dafi die 
dort' of f enbairten Interf ace-Baugruppen .4ind deren Betrieb noch 
25 zurErhShung der Prozessoref fizienz und/oder Leistung verbes- 
•serbar sind. Es wird daher nachfolgend im Rahmen der Erfin- 
' dung eine besondere Aiisgestaltung von Interface-Baugruppen . 
vorgeschlagen, wie sie insbesondere in DE 196 54- 595.1 offen-^ 
bart sind. 

.30 Jedes Interf ace-Baugruppen kann eine eigene eindeutige Ken- 
nung (lOID) besltzen, die von/zu einem Protokollkonverter 
■ -iibertragen wird" mid der Zuordnuhg von Datentransf ers zu einer 
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bestimmten Interface-Baugruppe oder der Adressierung einer 
bestiiranten Interface-Baugruppe dient. Die lOID kann bevorzugt 
durch eine CT konfigurierbar sein. 
• Die lOID kann beispielsweise verwendet werden, urn bei Zugrif- 
5 fen durch einen externen Master eine bestdLmmte Interface- 
Baugruppe fUr einen Datentransfer zu selektieren. 
Weiterhin kann die lOID verwendet werden um eingehenden Lese- 
daten die korrekte Interface-Baugruppe zuzuordnen. Dazu wird 
die lOID beispielsweise mit der Adresse eines Datenlesezu- 

10 grif fes in die lO-FIFOs tibertragen und entweder dort gespei- 
chert und/oder an den' externen Bus weitergeleitet. Die 10- 
FIFOs ofdnen den eingehenden Lesedaten die lOIDs. der ausge- 
sendeten Adressen zu und/oder die lOIDs werden uber den ex- 
ternen Bus mitabertragen und durch externe GerSte -oder Spei- 

15 Cher den zuruckgesendeten Lesedaten zugeordnet. 

lOIDs kannen dann die Multiplexer (.z.B. vor den Inter face- 
Baugruppen) derart anspreehen, dass diese die eingehenden Le- 
sedaten auf die korrekte Interface-Baugruppe leiten, 

2b Fiir gewohhlich arbeiten Interface-Baugruppen und/oder Proto- 
- kollkonverter als Busmaster.' In einer besonderen Ausftihrung 
wlrd nun 'vo^rgeschlagen/ dafl- -Interf ace-^Baugruppen und/oder 
Protokollkqnverter alternativ und/oder fest und/oder temporar 
-als Busslave arbeiten, ihsbesondere auf selektierbare Weise, 
\7S beispielsweise- im Ansprechen auf bestimmte Ereignisse, Zu- 
. stMnden von Statentachines in PAEs, Anforderungen einer zen- 
tralen Kbnfiguratiorisverwaltungseinheit (CT) usw. 
In einer zusatzlichen AUsfvihrung ^ind die Interface- 
Baugruppen derart erweitert^ dass generierten Adressen, i.b. 
.30 in SOFT-AG generierten Adressen, • ein bestimmtes Datenpaket 
zugeordnet wird- 
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Bine bevorzugte Ausgestaltiing einer Interf ace-Baugruppe ist 
nachf olgend beschr ieben : 

Eine bevorzugte Kopplung eine Interface-Baugruppe erfolgt da- 
durch^ dass beliebige PAEs (RMl, ALU^ etc) und/oder das Array 
5 (PA) tiber einen (bevorzugt konfigurierbaren) Bus ndt Inter- 
face-Baugruppen verbunden sind/ welche entweder mit den Pror 
tokollkonvertern verbunden sind oder die Protokollkonverter 
integriert haben. " 

In einer Ausgestaltimgvariante sind lO-FIFOs in den Inter- 
10 face-Baugruppen intergriert. 

Fur Schreibzugriffe (die VPU sendet Daten an externe 10, z.B. 
Speicher/ Peripherie o^a.) ist es vorteilhaft, den Adressout- 
put mit dem Datenoutput zu verkniipfen, d.h. eih Datentransfer 

15 mit der 10 findet exakt dann statt, wenn an der Interf ace- 
Baugruppe ein gultiges Adresswort und ein gultiges Datenwort 
ansteht, wobei die beiden Worte von unterschiedlichen Quellen 
staramen kSnnen. Zur Kennzeichnung der Gtiltigkeit kann bei- 
spielsweise ein Hahdshake-Protokoll nach DE 196 51 075,9 oder 

20 DE 101 10-530,4 (RDY/ACK) verweridet werden. Durch eine geeig- 
nete logische Verknvipfung (z.B. .'AND') der RDY Signale von 
Adresswort lirid Datenwort Ist das Vorhahdenseiri beider ' gtilti- 
ger Worte erkennbar und der lO-Zugriff kann durchgeftihrt wer- 
den. Mit der DurchfOhfuhg des Ip-Zugrif f es. kann die Quittie- 

25 rung der Daten- nind Adressworte erfolgen, indem das entspre- 
chende ACK fcir die beiden Transfets generiert wird- Der 10- 
Zugrif f* bestehend aus Adresse und Daten, sowie ggf.. der dazu- 
gehorenden- Statussignale kann erf indungsgemaB in Output-FIFOs 
entkoppelt werden. Bus steuer signale werden vorzugsweise in 

30 den Protokolikonverterri generiert. 
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Far Lesezugriffe (die VPD empfangt Daten von externer 10/ 
z.B. Speicher/ Peripherie o.a.) werden zunSchst die Adressen 
fttr den Zugriff von einem Adressgenerator (HARD-AG und/oder 
SOFT-AG) generiert und der Adresstransfer durchgef Qhrt . Die 

5 Lesedaten konnen im selben Takt oder bei hohen Frequenzen 
auch gepipelinet einen oder mehrere Takte spater eintreffen. 
Sowohl die Adressen als auch die Daten kdnnen durch lO-FIFOs 
. entkoppelt werden. 
Zur Quittierung der Daten kann das bekannte RDY/ACK Protokoll 

10 verwendet werden, das auch gepipelinet verwendet werden kann. 
(siehe DE 196 54 595.1, DE 197 04 742,4, DE 199 26 538.0, DE 
100 28 397.7, DE 101 10 530.4). 

Zur Quittierung der Adressen kann ebenfalis das bekannte 
RDY/ACK Protokoll verwendet werden. Eine Quittierung der 

15 Adresse durch den Eiq)f anger bewirkt jedoch eine sehr groBe 
Latenzzeit, die sich negativ auf die Performance von VPUs 
auswirken kann. Die Latenzzeit kann umgangen werden, indem 
die Interface-Baugruppe den Empfang der Adresse quittiert und 
die Synchronisation des Eingangs der der Adresse zugeordneten 

20 Daten rait deia Adresse uberninuat. 

'Die Quittierung und Synchronisation kann durch "eine beliebige 
geeignete Quittierungs-Schaltung erfolgen. ' Zwei mSgliche Aus- 
gestaltungen seien im Folgenden riibht-iimitiererid nSher aus- 
25 gefahrt: 
a) FIFO- 

Ein FIFO speichert die ausgehenden Adresszyklen der extqrnen 
Bustransfers. Mit jedem^ als Antwbrt auf einen externen Buszu- 
griff eingehenden Datenwort* wird der FIFO entsprechend ge- 
.30-. lehrtl Durch den- FIFO-Character "entspricht die Reihenfolge 

der ausgehenden Adressen- .der Reihenfolge der ausgehenden Da- 
tenworte. Die Tiefe des FIFOs (also die Zahl der moglichen' 
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Eintrage) wird vorzugsweise an die Latenzzeit des externen 
Systems angepafit, sodass jede ausgehende Adresse ohne Latenz 
quittiert werden kann und der optimale Datendurchsatz er- 
reicht wird. Eingehende Datenworte werden entsprechend des 
5 FIFO-Eintrages der zugeordneten Adresse quittiert. Wenn der 
FIFO voll ist, kann das externe System keine weiteren Adres- 
sen mehr annehmen und die aktuelle ausgehende Adresse wird so 
lange nicht quittiert und damit gehalten, bis Datenworte ei- 
nes vorhergehenden Bustransfers eingegangen sind und ein FI- 
10 FO-Eintr,ag entfernt wurde. 1st der FIFO leer^ wird kein gtil- 
tiger Bustransfer ausge'fUhrt und ggf . eintreffende Datenworte 
werden nicht quittiert. 
b) Creditcounter 

Jede ausgehende Adresse von externen Bustransfers wird quit- 
15 tiert und zu einem Zahler dazuaddiert (Creditcounter) . Einge- 
hende Datenworte als Antwort auf einen externen Bustransfer 
werden werden von dem zahler abgezogen. Erreicht der ZSLhler 
einen definierten HSchstwert, kann das externe System keine 

• weiteren Adressen mehr annehmen und die aktuelle ausgehende 
20 Adresse wird so lange nicht quittiert und damit gehalten, bis 

Datenworte eines vorhergehenden Bustransfers eingegangen sind 
. und der zahler dekrementiert wurde. Tst der zahler stand hull, 
wird kein gultiger Bustransfer ausgefOhrt \md ggf. eintref- 
fende Datenworte werden. nicht quittiei;;t. 
25 Urn Burs ttransfers optimal zu untersttitzen wird die LSsung 
mittels a) (FrFG)- besonders bevorzu-gt, insbesondere konnen 
FIFOs ahnlich den nachfolgend beschriebeneri FIFOs zur Abwick- 

• lung von Burstzugriffen und der Zuordnung von lOlDs zu den 
Lesedateh eingesetzt werden. ' 

.30 . • . 
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In die Interface-Baugruppen kOnnen die beschriebenen lO-FIFOs 
integriert sein. Insbesondere kairn ftlr die Ausgestaltungsva- 
riante a) auch ein 10- FIFO verwendet werden. 

5 Es vnirde vorstehend schon die optionale MSglichkeit offen- 
bart/ Protokollkonverter vorzusehen. Zu besonders vorteilhaf- 
ten mQglichen Ausgestaltungen von Protokollkonvertern sei das 
Nachfolgende angemerkt: 

10 Ein Protokollkonverter ist fur die Verwaltuhg und Steuerung 
eines externen Busses zustandig. Detailaufbau und -funktion 
eines Protokollkonverter sind von der Ausgestaltung des ex- 
ternen Busses abhangig. Beispielsweise erfordert ein AMBA Bus 
einen anderen Protokollkonverter als ein RAMBUS. Unterschied- 

15 liche Protokollkonverter sind an die Interface-Baugruppen an- 
schlielibarr innerhalb einer Ausgestaltung einer VPD k5nnen 
mehrere und insbesondere unterschiedliche Protokollkonverter 
implement iert sein. 

In einer bevorzugten Ausgestaltung- sind die Protokollkonver- 
•20 ter in den ID FIFOs der vorliegenden Erfindung integriert. 

•Es ist erf indungsgem^fi moglich,. Burst-Buszugrif f e vorzsehen. 
Moderne Bussystem und SoC-Bussysteme transferieren groBe Da- 
tenmengen mittels sogenannter Burst-Sequenzen. Dabei wird zu- 
25 nachst eine Adresse tibertragen und dann fiir .eine Anzahl ^von 
Takten ausschlieBlich Daten transferiiert (siehe AMBA Specif ir 
cation 2.0, ARM Limited)/. 

Zur korrekten burjchf Ohrung von Burst-Zugrif f en sind mehrere 
30 Aufgaben zu 15sen: 

1) Erkennen von Burstzyklen 
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Lineare Buszugriffe^ die in Bursts umgewandelt werden konnen, 
mtissen erkannt werden, urn Bursttransfers auf dem externen Bus 
auszul5sen. Zur Erkennung linearer Adressfolgen kann ein zah- 
ler (TCOONTER) eingesetzt werden, der zunfichst mit einer er- 
5 sten Adresse eines ersten Zugriffes geladen wirdund nach je- 
dem Zugriff linear auf/ab zahlt. Sofern die darauffolgende 
Adresse dem zahlerstand entspricht liegt eine lineare und 
burstfahige Reihenfolge vor. . 
2) Abbruch an Boundaries 

10 Manche Bussysteme (z.B. AMBA) lassen Bursts (a) nur bis zu 
einer bestiiranten Lange, bzw. (b) nur bis zu bestiinmten 
Adressgrenzen (z.B. 1024 Adress Blocke) zu. Ftir (a) kann dann 
erfindungsgemSfi ein einfacher Zahiler implementiert werden, 
der vom ersten gewUnschten bzw. erforderlichen Buszugriff an 
• 15 die l^zahl der Datentibertragungen zahlt und bei eineia be- 
stiiniuten Wert, der der maximalen LSnge des Bursttransfers 
entspricht, z.B. mittels eines Vergleichers die Boundarygren- 
ze signalisiert . Fur (b) kann das entsprechende Bit (z.B, fQr 
, 1024 Adress Grenzen das 10. bit), das die Boundarygrenze dar- 

20 istellt, zwischen TCOUNTER und der aktuellen Adresse vergli- 
Chen werden (z.B. mittels einer XOR Funktion) . 1st das Bit in 
TCOUNTER ungleich dem Bit in der aktuelleA Adresse lag ein 
(Jbergang iiber eine Boundarygrenze vor, der entsprechend si- 
gnalisiert wird. 

25 3) Festlegen der Lange 

Sofern das exteme Bussystem keine Angabe zur Lange eines 
Burst zyklus benotigt, ist es moglich und erf indurigsgem^a be— 
vorzugt, Bursttransfers unbestimmter* Lange durchzufuhren 
(vgl. AtffiA) . Werden Langen^ngaben erwartet und/oder bestimmte 
. 30 Burstiangen vorgegeben, .kann erf indungsgemaB folgendermaBen 
vorgegangeh werden : Die zu iibertragenden .Dateri und Adress en 
werden in ein FIFO bevorzugt unter Mitverwendun-g des lO-FIFOs 
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dafar, geschrieben und sind anhand der Anzahl der Adressen im 
(10-) FIFO bekannt. Fur die Adressen wird ein Adress-FIFO ver- 
wendet, das im Mastenaodus die Adressen von den Interface- 
Baugruppen zum externen Bus Obertragt und/oder im Slavemodus 
5 umgekehrt arbeitet. Die Daten werden in ein Daten-FIFO ge- 
schrieben, das die Daten entsprecherid der Obertragung 
(Schreiben/Lesen) tibertrcLgt. Insbesondere kann ftir Schreib 
und Lesetransfers je ein unterschiedliches FIFO verwendet 
werden. Die Bustransfers kSnnen nunmehr derart in fixe Burst- 

10 IcLngen unterteilt werden, dass diese vor den einzelnen 

Bursttransfers bekannt sind und bei der Einleitung der" Burst 
angegeben werden konnen, wobei vorzugsweise zunachst Bu- 
stransfers der maximalen BurstlSlnge gebildet werden und wenn 
die Anzahl der verbleibenden (I0-) FIFO-Eintrage kleiner als 

15 die aktuelle Burstlange ist jeweils eine na.chst kleinere 
BurstlSnge verwendet wird. Beispielsweise konnen 10 (10- 
) FIFO-Eintrage bei einer maximalen Burstlange von 4 mat 4,4,2 
Bursttransfers Obertragen werden. 
4) Error Recovery 

20 Hanche externen Bussysteme (vgl. AMBA) sehen Verf ahreri' zur 
Fehlerbeseitigung vor, wobei beispielsweise fehlgeschlagene 
Bustransfers wiederholt werden. Die Information ob ein. Bu- 
stransfer fehlgeschlagen, ist wird am Ende eines Bustransfers- 
Obertragen, quasi als Quittung fur dea Bustransfer. Dm einen 

25 Bustransfer zu wiederholen ist es nunmehr erforderlich., dass 
samtliche Adressen und bei Schreibzugrif f en auch die w'egzu-' 
schreibenden Daten noch zur Verftigung- stehen.. Erf indungsgemafi - 
. wird im Hinblick hierauf vorgeschlagen, dazu die Adress-FIFOs- 
(bevorzugt die Adress-FiFOs der ID-FIFOs) derart zu. modif i- - 
. 30 zieren, dass der Lesezeiger vor jedem Bursttransfer gespei- 
chert wird^ Bs ist somit einFIFO- 

Lesezeigerpositionsspeichermittel,^ insbesondere ein AdreB- 
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FIFO-Leserzeigerpositionsspeichennittel vorgesehen . Dieses 
kann einen integralea Teil des Adress-FIFOs bilden, in dem 
beispielsweise ein Flag vorgesehen wird, das anzeigt, daB ei- 
ne im FIFO abgelegte Information eine Lesezeigerposition dar- 

5 stellt, Oder es kann separat zxm FIFO vorgesehen werden. Al- 
ternativ k5nnte auch vorgesehen werden, den im FIFO abgeleg- 
ten Daten einen die Loschbarkeit anzeigenden Status zuzuord- 
nen, der mitabgelegt ist und diesen Status auf „16schbar*' zu- 
rUckzusetzen, sofern die erfolgreiche Datenubertragung quit- 

10 tiert wurde, Sofern ein Fehler auftrat, wird der Lesezeiger 
wieder auf die zuvor gespeicherte Position gesetzt undder^ 
Bursttransfer wiederholt. Trat kein Fehler auf,- wird der 
nachste Bursttransfer durchgeftihrt und der Lesezeiger ent- 
sprechend neu gespeichert, Um zu verhindern, dass der 

15 Schreibzeiger in einen aktuellen Bursttransfer gelangt und 
damit Werte iiberschrieben werden, die evtl. bei einer Wieder- 
holung des Bursttransfers noch benotigt werden, wird der 
Vollzustand der FIFOs durch den Vergleich des gespeicherten 
Lesezeigers mit dem Schreibzeiger festgestellt . 

20 

lO-FIFOs und/oder die FIFOs zur Verwaltung von Bursttransfers 
konnen bevorzugt jeweils mit der von den Interface-Baugruppen 
bekannten Funktion der Adresszuordnung. zu eingehenden Leseda- 
ten erweitert sein. Dabei kann den eiixgehenden Lesedateri auch 
25 die lOID zugeordnet werden, die bevorzugt zusammen mit den 
Adressen in den FIFOs gespeichert wird. Durch die Zuordnung 
der lOID zu eingehenden Lesedaten ist die Zuordnung- der. Lese- 
daten zu den entsprechenden Interface-Baugruppen mQglich, in- 
dem beispielsweise die Multiplexer entsprecheud der lOID ge- 
.,30 schaltet werden. 
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ErfindungsgemaB ist es moglich/ bestiiniate Bussysteme zu ver- 
wenden und/oder Bussysteme auf unterschiedliche Weise auszu- 
gestalten. Dies wird nachfolgend erGrtert. Ausgestaltungsab- 
hangig konnen zwischen den einzelnen Einheiten, insbesondere 
5 den Inter face-Baugruppen, den lO-FIFOs^ den Protokollkonver- 
tern unterschiedliche Bussysteme zum Einsatz kommen, wobei 
zwischen je zwei Einheiten ein anderes Bussystem iirplemen- 
tiert sein kanin. Unterschiedliche Ausgestaltungen sind imple- 
mentierbar, wobei die Funktionen mehrere Ausgestaltungen in- 
10 nerhalb einer Ausgestaltung zusammengef aflt sein kGnnen, 
Einige AusgestaltungsmSglichkeiten sind nachfolgend auf ge- 
fahrt. 

Die einfachste mdgliche Ausgestaltung ist die direkte Verbin- 
dung von zwei Einheiten. 
15 In einer erweiterten Ausfiihrung liegen Multiplexer zwischen 
den Einheiten, die unterschiedlich ausgestaltet sein konnen. 
Dies Ausftihrung wird besonders bei der Verwendung mehrere der 
jeweiligen Einheiten bevorzugt. 

Eine Multiplex- Funktion kann dxirch einen konf igurierbaren Bus 
20 entstehen, der von. einer Obergeordenten Konfigurationseinheit 
(CT) jeweils far einen Zeitraum fUr die Verbindung best.iiranter 
Einheiten untereinander konfiguriert werden kann. 
In einer bevorzugen Ausftihrung sind die Verbindungen durch 
Selektoren, die beispielsweise einen %e±l einer Adresse 
25 und/oder eine lOID dekodieren, definiert, indem diese die 
Multiplexer zur Vefscha-ltung der Einheiten ansteuern.. 
In einer besonders bevqrzugten AusfUhrung sind die Selektoren 
derarf ausgestaltet, dass mehrere Einheiten zugleich. eine an- 
dere Einheit selektieren kQnhen, wobei in zeitlichex Reiheh- 
30 folge jeweils eine der Einheiten. zur Selektion arbitriert 
. wird. Ein beispielsweise geeignetes Bussystem ist in DE 199 
26 538. G beschrieben. 
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Ftir die Arbitriening konnen zusatzliche Zustande verwendet 
werden, Beispielsweise konnen Datentransfers zwischen den In- 
terface-Baugruppen und den lO-FIFOs folgendermassen optimiert 
5 werden: 

Jewells eln Block einer deflnierten Gr5fie von zu transferie- 
renden Daten wird innerhalb der FIFO-Stufen zusannaengefaflt . 
Sobald ein Block voU/leer ist wird dent Arbiter ein Buszu- 
griff signalisiert, im die Daten zu Ubertragen. Die Daten 

10 werden in einer Art Burst-Transfer tibertragen, d.h. der ge- 
samte Datenblock wird w^hrend einer Busztiteilungsphase durch 
den Arbiter iibertragen, Mit anderen Worten, kann eine Buszu- 
teilung bedingt durch FIFO-Zustande der angeschlossenen FIFOs 
erfolgen, wobei innerhalb eines FIFOs Datenblocke zur Zu- 

15 standsbestiiiimung verwendet werden konnen. Ist ein FIFO voll^ 
kann er den Bus zur Entleerung arbitrieren; ist ein FIFO 
leer, kann er den Bus. zur Ftillung arbitrieren. Zusatzliche 
Zustande kdnnen vorgesehen sein, beispielsweise in Flush, der 
zur Entleerxing nur teilweise voller FIFOs und/oder zur Fttl- 

20 lung nur teilweise leerer FIFOs verwendet wird. Ein Flush 

kann beispielsweise bei einem Konfigurationswechsel (Rekonfi- 
guration) verwendet werden. 

In einer bevorzugten Ausgestaltung sii)4 die Bussysteme urn ho- 
25 he Datentransfer- und Taktraten zu erreichen durch geeignete 
R^gistexstufen als Pipelines aufgebaut iind konnen beispiels- 
weise selbst als flFO arbeiten-. 

In einer bevorzugten Ausgestaltuiig kanri die Multiplexerstufe . 
. 30 ebenfalls gepipelinef ausgestaltet sein. 
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Erfindungsgemafi ist es mOglich, mehrere Module an eine 10 an- 
zuschlieBen und eine Koramunikation der Module untereinander 
vorzusehen. Hierzu sei Folgendes angemerkt:- 
Aus DE 198 07 872.2, DE 199 26 538.0, DE 100 28 397.7 sind 
5 Konfigurations-Module bekannt, die eine bestimmte Funktion 
beinhalten, die wiederverwertbar und/oder innerhalb des PA 
relokatierbar sind. 

Mehrere dieser Konf igurations.-Module k5nnen abhSngig und/oder 
unabhangig voneinander zugleich in das PA konf iguriert. wer- 
10 den. 

Die Konfigurations-Module mtissen auf eine. liraiti'erte und. 1ns- 
besondere typischerweise nur an bestinmiten Stellen vorgesehe- 
ne und daher nicht relokatierbare 10, derart verschaltet wer- 
den, dafi die Konfigurations-Module die 10 zugleich benutzen 

15 konnen und die Daten den korrekten Modulen zugeordnet werden. 
Welterhin mUssen zusainmengehorende (abhangige) Konfigura- 
tions-Module derart miteinander zu verschaltet werden, daB 
eine freie Relokation der Konfigurations-Module untereinander 
im PA moglich ist. 

20 • 

Durch die gewohnlichen Netzwerke' (P 44 .16 881.0, 02, 03, 08) 
ist ein' derart flexibler Aufbau* ziomeist nicht moglich, da 
dieses Netzwerk Ublicherweise mittels eines Routers explizit 
alloziiert und geroutet werden mufi. 

25 

m DE 197 q4 742',4 ist ein Verfahren beschrieben,* urn fle-xible 
Datenkanale innerhalb einer. PM-Matrix entsprechend der aus- 
• zufuhrenden Algorithmen, so auf zubauen, daB eine direkte Ver- 
♦ b'indung durch- eine und entsprechend einer DatenObertragung 
30 entsteht und danach wieder abgebaut wird. Die iibextragenden 
Daten konnen jeweils exakt einer Quelle und/oder einem Ziel 
zugeordnet werden. 
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Zus^tzlich und/oder alternativ zu DB 197 04 742.4 und der 
dbrt beschriebenen Vorgehensweise und den dort beschriebenen 
Anordhungen sind nun erfindungsgemafl weitere McSglichkeiten 
5 gegeben und Verf ahren (nachf olgend zusammengef alit mit Global- 
Track bezeichnet) einsetzbar, die eine flexible Alloziierung 
und Vemetzung zur Laufzeit ermoglichen/ z.B. serielle Busse^ 
parallele Busse, Lichtleiter mit jeweils geeigneten Protokol- 
len (z.B, Ethernet r Firewire, USB) . Es soil ausdrticklich auf 
10. die Obertragung per Licht durch ein . lichtleitendes Substrat 
insbesondere bei geeigneter Modulation zur . Trennung der Kancl- 
le hingewiesen werden. ETine weitere Besonderheit der Erfin- 
dung mit Bezug auf die Speicheradressierung, insbesondere die 
M5glichkeit des Paging und MMU sei nachf olgend diskutiert. 

15 

Die Datenkanaie eines odere mehrerer GlobalTrack konnen Ober 
* Vermittlungs-Khoten mit einem gewShnlichen Netzwerk bei- 
spielsweise nach P 44 16 881.0, 02, 03, .08 verbunden werden. 
Die Vermitt lungs -Knot en kSnnen je nach Implementierung unter- ; 
•20 schiedlich im PA angeordnet sein, beispielsweise jeder PAE, 
einer Gruppe und/oder Hierarchie von PAEs und/oder jeder n- 
ten PAB zugeordnet sein. 

In einer besonders bevorzugten Ausgestaltung weisen saratliche 
. PAEs, Interface-Baugruppen/ etc- einei), dedizierten AnschluB 
25' . auf einen GlobalTrack auf 

. Ein Konfigurations-Modul wird deraxt gestaltet, da-fi es Zu- 
- griff auf einen oder. mehrere dieser Vermittlungs-Knoten er— 
haltv - ' * 

30 . Mehrere Konfigurations-Module untereinander und/oder Konf igu-. 
rations-Module und. 106 lassen sich nunmehr uber den Global- 
Track miteinander verbinden. Bei entspreghender Implementie- 
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rung (z-B. DE 197 04 742.4) lassen sich mehrere Verbindungen . 
gleich^eitig aufbauen und benutzen. Die Verbindung zwlschen 
Sendern und Empf^ngern kann adressiert erfolgen, sodass eln 
indlvidueller Datentranfer ermOglicht wird. Mit anderen Wor- 
5 . ten sind Sender und Empf anger tlber den GlobalTrack identifi- 
zlerbar. Damit lassen sich Ubertragene Daten eindeutig zuord- 
nen. 

Mittels einer erweiterten 10, die die Sender und EmpfSn- 
gelradresse mit tibertrSgt - wie .beispielsweise aus DE 101 10 
10 530,4 bekannt - und der Multiplexing-Verfahren nach DE 196 54 
595-1/ k5nnen Daten fur unterschiedliche Module iiber die 10 
Obertragen werden und sind ebenfalls eindeutig zuzuordnen. 

* Der Datentransfer wird in einer bevorzugten Ausgestaltung 

15- synchronisiert beispielsweise iiber Handshake-Signale. Welter- 

• hin kann der Datentransfer gepipelinet also iiber mehrere im 
GlobalTrack implement iert en oder diesem zugewiesenem Regi- 
stern erfolgen. In einer sehr komplexen Ausfuhrung fiir .groBe 
VPU*s bzw. deren Vernetzung untereinander, kann ein Global- 

20 Track in einer Netzwerktopologie mit Switches und Routers 

• aufgebaut sein beispielsweise kann Ethernet eingesetzt wer- 

• den . 

Dafl verschieden Medien fUr GlobalTrack Topologien verwendet 
' werden konnen, z.B. das Verfahren. nacht^ DE 197 04 742,4 far 
25 VPU-interne Verbindungen und Ethernet, fur Verbindungen zwi- 
schen VPQs, sei erwahnt* 

Speicher (z,B^ RAM-PAEs) korlnen mit einem MMU ahnlichen Page- 
Ingverfahren ausgestattet- sein. Beispielsweise. kann dadurch 
30. ein. grofier externer Speicher in Segmente (Pages) zerlegt wer- 
den, die im Falle eines Datenzugrif f s innerhalb eines Segmen- 
tes in eihen der internen Speicher geladen und zu einem sp^- 
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teren Zeitpunkt nach Beendigung des Datenzugif fes wieder in 
den externen Speicher geschrieben werden. 

In einer bevorzugten Ausgestaltung werden an einen (internen) 
Speicher geleitete Adressen in einen Adressbereich, der in- 
5 nerhalb des internen Speichers (MEMADR) liegt (z.B. die unte- 
ren,10 bit bei einem 1024 EintrSge Speicher)^ und eine Sei- 
tenadresse (die Bits oberhalb der unteren 10) zerlegt. Die 
GrOfie einer Seite/Page ist somit durch MEMADR bestiiraat. 

10' Die Seitenadresse wird mit einem dem internen Speicher zuge- 
ordneten Regis te^r (Seitenregister) verglichen. Das Register 
speichert den Wert der Seitenadresse, die zuletzt aus einem 
iibergeordneten externen (Haupt-) Speicher in den internen 
Speicher transferiert wurde, 

15 Stimmt die Seitenadresse mit dem Seitenregister Qberein, kann 
ein wahlfreier Zugriff auf den internen Speicher stattfinden. 
Sofern die Adresse nicht Ubereinstiromt (Pagefault) wird der 
aktuelle Seiteninhalt an die Stelle die durch das Seitenregi- 
stepc angegeben ist vorzugsweise linear in den externen 

20 (Haupt-) Speicher geschrieben. 

Der an der Stelle der aktuellen neuen Seitenadresse beginnen- 
de Speicherbereich im externen (Haupt-) Speicher (Seite/Page) 
wird in den internen Speicher geschrieben, 

25 In einer besondeirs bevorzugten Ausftihrung kann durch Konfigu-. 
ration vorgegeben werden, ob bei einem Pagefault die neue 
Seite aus dem externen (Haupt^) Speicher in den internen Spei-' 
cher ubertfagen werden soil oder nicht. 

In einer besonders bevorzugten AusfQhriing kann durch konfigu- 
30' ration vorgegeben werden, ob bei einem Pagefault . die alte 
Seite von dem internen Speicher in den externen (Haupt- 
) Speicher tibertragen werden soil oder nicht. 
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Der Vergleich der Seitenadresse mit dem Seitenregister er- 
folgt bevorzugt innerhalb des betreffenden Speichers. 
• Die Datentransfersteuerung bel Pagefaults kann durch beliebi- 
5 ge PAEs entsprechend konfiguriert werden und/oder durch DMAs 
(z.B. in den Inter face-Baugruppen oder externe DMA) erfolgen. 
In eines besonders bevorzugten Ausftlhrung sind die internen 
Speicher als aktive Speicher mit integrierter Datentransfer- 
steuerung ausgelegt (vgl, DE 199 26 538 •0). 

10 

In einer weiteren iti5glichen Ausfdhrung kann ein interner 
Speicher mehrere (p) Pages aufweisen, wobei die GrOBe einer 
Page dann bevorzugt der SpeichergroBe geteilt durch p be-- 
trSgt. Eine Obersetzungstabelle (Translation Lookaside Buffer 

15 = TLB) , die bevorzugt ^hnlich eines voll assoziativen Caches 
ausgestaltet ist, ersetzt das Seitenregister und Obersetzt 
Seitenadressen auf Adressen im internen Speicher^ mit anderen 
Worten kann eine virtuelle auf eine physikalische Adresse 
tibersetzt werden. 1st eine Page nicht in der Obersetzungsta- 

20 belle (TLB) beinhaltet tritt ein PageFault auf. Weist die 
Obersetzungstabelle keinen Platz far neue zusStzliche Pages, 
auf, konnen Pages aus dem internen Speicher in den externen 
(Haupt-) Speicher ubertragen und aus der Obersetzungstabelle 
entferhf werden, sodass wieder Freira^fu im internen Speicher 

25 ; zur. Verfiigung steht. 

Es soli ausdriicklich. darauf hingewiesen werden, dass sich ei- 
ne detaxlliertere Ausfiihrung eriibrigt,- da eine Vielzahl per 
se bekannter MMU-Verfahren nach dem Stand der Technik ein- 
. 30 setzbar ist und mit geringfugigen und of fensichtlichen Modi- 
fikationen einsetzbar ist. 
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Es vmrde bereits vorstehend die Moglichkeit erwahnt, einen 
sogenaiinten Collectorspeicher vorzusehen. Hierzu sei nunmehr 
noch detaillierter Folgendes ausgefdhrt: 

Zwischen die Interface-Baugruppen und die lO-FIFOs kann ein 
5 Sammelspeicher (Collector) geschaltet werden, der gr6Bere Da- 
tenmengen speichern kann. 

Der Collector kann zum Austausch von Daten zwischen den In- 
ter face-Baugruppen, bzw. zwischen Speichern die dem Array zu- 
geordnet sind (z.B. RAM-PAEs) verwendet werden. 
10 Der Collector kann als Puffer zwischen den Daten innerhalb 
eines rekonfigurierbaren Bausteins und externen Daten verwen- 
det werden. 

Ein CoXlector kann als Puffer von Daten zwischen unterschied- 
lichen Rekonf igurationsschritten dienen, beispielsweise kann 

15 er die Daten unterschiedlicher Konf igurationen speichern/ 

wahrend andere Konf igurationen gerade konfiguriert und aktiv 
sind. Bei der Deaktivierung von Konf igurationen speichert er 
• deren Daten und die Daten der nunmehr neu konfigurierten und 
aktiven Konf igurationen werden, werden zum PA, z.B. in Spei- 

20 chern die dem Array zugeordnet sind (RAM-PAEs), ubertragen. 

. Eine Mehrzahl von Ihterf ace-Baugruppen kann Zugriff auf den 
Collector haben und Daten in jeweils getrennten und/oder ge- 
meinsam zugreifbaren Speicherbereicheiiu verwalten. 
25 In einer bevorzugen Ausgestaltuhg kann der Collector mehrere 
Anschlusse ftir Iriterface-Baugruppen aufweisen, auf die zeit- 
gleich zugegriffen werden kann (d.h. er wird als Multi-Port- 
Cdllectprmittels ausgebildet) . ' 

Der. Collector besitzt einen odier mehrere Anschiasse an einen 
•30 externen Speicher und/oder die externe Peripherie. Diese kon 
lien insbesondere mit den lO-FIFOs verbunden sein. 
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In einer erweiterten Ausgestaltung konnen der VPO zugeordne- 
ten Prozessoren wie DSPs, CPUs, Mikrokontroller auf den Col- 
lector zugreifen. Dies erfolgt bevorzugt Ober ein weiteres 
Multi-Port Interface. 
5 In einer bevorzugten Ausgestaltung ist dem Collector eine 
Adressiibersetzungstabelle zugeordnet. Jedes Interface kann 
eine eigene Adressiibersetzungstabelle oder alle Interface ei- 
ne gemeinsame Adressiibersetzungstabelle besitzen. Die Adress- 
ubersetzungstabelle kann von dem PA und/oder einer CT 

10 und/oder einer externen Einheit verwaltet werden. Die Adress- 
iibersetzungstabelle dient der Zuordnung von Collector Spei- 
cherbereichen zu beliebigen Adressen und arbeitet ahnlich ei- 
nem MMU-System. Ist ein Adressbereich (Page) nicht innerhalb 
des Collector vorhanden (pagemiss) , kann dieser- Adressbereich 
, 15 aus einem externen Speicher in den Collector geladen werden. 
We it erhin konnen Adressbereiche (Pages) aus dem Collector in 
den externen Speicher geschrieben werden. 
Zum Datentransfer zum bzw. zwischen dem externen Speicher 
. wird bevorzugt eine DMA verwendet. Der DMA wird ein Speicher— 

20 bereich innerhalb des Collector zur lesenden oder schreiben- 
den Obertragung angegeben, die entsprechenden Adressen im ex- 
ternen Speicher konnen separat angegeben werden oder bevor- 
zugt von der DMA aus der Adressubersetzungstabelle entnommen 
werden; * 

25 

Ein Collector lind dessen Adressgeneratoren (z.B. DMA) konnen- 
bevorzu'cft entsprechend oder ahnlich per se bekannter MMU- 
Systeme fai:' Prozessoren nach ddoii Starid der Technik arbeiten. 
Adressen kSnneii mit ttb'ersetzungstabel'leii (TLB) f tir einen Zu- 
. 30 griff auf deii Cpll^ct6r iibersetzt werden.- S.amtliche ftir in- 
terne Speicher beschriebeneri MMU-Ausgestaltungen und Verf ah- 
ren kShnen erfindungsgemSB auf einen Collector angewendet 



wo 02/071248 



PCT/EP02/02398 



werden. Auf die Arbeitsweisen wird nicht n|her eingegangen, 
da diese dem Stand der Technik entsprechen oder sehr ahnlich 
sind. 

5 In einer erweiterten bzw. bevorzugten Ausgestaltung k5nnen 
mehrere Collectoren implement iert sein. 

Es ist erfindungsgemafi mCglich, die Speicherzugriffe zu opti- 
mieren. Hierzu sei Folgendes angemerkt: • - 

io . 

Eine Grundeigenschaf t der bevorzugen rekonfigurierbaren VPU 
Architektur PACT-XPP ist die Moglichkeit Rekonf iguration und 
Datenverarbeitung zu iiberlagern (vgl. P 44 16 881,0, DE 196 
51 075-9, DE 196 54 846. 2,. DE 196 54 593.5, DE 198 07 872.2, 
15 DE 199 26 538.0, DE 100.28 397.7, DE 102 06 857/7). Mit ande- 
iren Worten kann 

a) z.B. WcLhrend einer Datenverarbeitung bereits die nachste 
, Konf iguration vorgeladen werden und/oder 

b) z.B. w^hrend eine'Anzahl von konf igurierbaren Element en 
20 einer bestimmten Konf iguration noch nicht konfiguriert sind, 

bzw. gerade konfiguriert werden, die Datenverarbeitung in an- 
deren bereits konf igurierten Elementen bereits beginnen- 
und/oder 

c) z.B. die Konf iguration verschieden^ Aktivitaten derart 

25 . -entkoppelt oder tiberlagert werden, dass diese unter optimaler 
Performance gegenieinander zeityersetzt ablaufen (ygl. 8.1 
Adressgenerierung) 

Moderne Speicherprotokolle (z.B. SDRAM, DDRAM, RAMBUS) weisen 
30 * zumeist folgenden oder einen in der Wirkung ahnlichen Ablauf 
auf, wobei Schritt 2 und 3 evtl. auch umgekehrt auftreten: 
1. Initialisierung eines Zugriffes mit Adr'essahgabe 
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2. Lange Latenzzelt 
■ 3. Schnelle Obertragxang- von Datenbl5cken zuitielst als Burst 

Diese Eigenschaft kann in der VPU Technologie performance- 
5 efflzient ausgenutzt werden. Beisplelsweise 1st es m5gllch, 
die Schritte der Berechnung der Adresse(n) , der Initiallisie- 
.rung des Speicher-Zugrif f es, des Datentransfer und der Daten- 
verarbeitung im Array (PA) jeweils derart zu trennen, dass 
verschiedene (zeitliche) Konfigurationen entstehen, wodurch 
10 eine weitgehend optimale Oberlagerung der Speicherzyklen und 
der Datenverarbeitungszyklen erreicht werden kann. Mehrere 
• der Schritte konnen je nach Anwendung auch zusammengefasst 
sein. 

Folgendes Verfahren entspricht beisplelsweise diesem Prinzlp: 
1-5 Es soil die Applikation AP ausgefuhrt werden, die aus einer 
Vielzahl von Konfigurationen (ap=l, 2, . . . , z) besteht. Weiter- 
hin werden auf der VPU welter Applikationen/Konf iguratlonen 
ausgefuhrt, die unter WA zusammengef aBt sind 

1. zunachst werden" (in einer ap. Konf iguration von AP) die 
20 Lese-Adressen berechnet, die Datentransf ers und die lO-FIFOs 

initialisiert, 

2. die fur AP abertragenen und Irizwlschen in den lO-FIFOs 
vorhanden Daten werden (in. einer ap+1.. Konf iguration) verar^ 
beitet und ggf . in FIFOs / Puffer / Zwischenspeicher / etc. 

25 abgelegt, 

*2a. die Berechnung" der Ergebnisse kann mehrere Kbnfigurati- 
onszyklen (n) erfordern, an deren Ende die Ergebnisse in .el- 
neiru lO-FIFO gespeichert sind. 

3. die Adressen .der Ergebnisse werden berechnet und der Da- 
30 tentransfer i-nitialisiert; dies . kann parallel oder spater in 

derselben oder einer ap+n+2. Konf iguration erfolgen, zugleich 
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Oder zeitlich versetzt werden dann die Daten aus den lO-^FIFOs 
in die Speicher geschrieben. 

Zwischen den Schritten k5nnen beliebige Konfiguration aus WA 
ausgefflhrt werden, z.B, wenn zwischen den Schritten eine War- 
5 tezeit riotwendig ist, da Daten noch nicht zur Verftigung ste- 
hen. - 

Ebenfalls konnen wShrend der Schritte parallel zu der Verar- 
beitung von AP Konf igurationen aus WA ausgeftihrt werden, z.B. 

• • wenn AP die ftir WA benotigten Ressourcen nicht verwendet. 

10 

Es ist dem Fachmann offensichtlich, dass unterschiedlich mo- 
difiz.ierte Ausgestaltungen des Verfahrens moglich sind. 

In einer m5glichen Ausgestaltung kann das Verarbeitungsver- 
15. fahren f olgendermassen ablaufen (Z markiert einen Konfigura- 
tionszyklus, bzw. eine Zeiteinheit) : 



z 


Konfiguration AP 


andere Konfigura- 
tionen (WA) 






beliebige andere 
Konf igurationen 
und/oder Daten-^ 
verarbeitungen, 
Schreib/lese- 
vprg^nge itiit 10- 
FIFOs- und/oder 
RAM^PAEs in ande- 
ren oder iiber 
Konf igur atibits zy- 
■kien zeitgemulti- 
plexten Ressour- 
cen ^ . 


1 


Leseadressen berechnen, Zugrif f in- . 
itialisierfen 


2 


Daten einlesen 


3+k 


Daten verarbeiten- 

(ggf . in mehrerefi (k) Konfigurations- 
zyklen) 


4+k 


Schreibadressen berechnen, Zugriff in- 
itialisieren 


5+k 


Daten ausschreiben 
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Dieser Ablauf kann insbesondere von dem Datenverarbeitungs- 
verfahren nach DE 102 02 044.2 effizient genutzt werden. 

5 Die vorstehenden Verf ahren und Vorrichtungen werden bevorzugt 
betrieben unter Verwendung besonderer Compiler, die gegeri(iber 
herkOmmlichen Compilern besonders erweitert sind. Hierzu sei 
. Folgendes angemerkt: 

10 Zur Generierung von Konf igurationen werden Compiler einge- 
setzt die auf einem beliebigen Rechnersystem ablauf en. Typi- 
sche Compiler sind z.B. C-Compiler. iind/oder ftir die VPU Tech- 
nologie z.B. auch NML-Compiler. Besonders geeignete Compiler- 
verfahren sind in z.B. DE 101 39 170.6, DE 101 29 237.6, EP - 

15 02 001 331.4 beschrieben. 

Der Compiler soil bevorzugt folgende Bespnderheiten zumihdest 

partiell beachten: 

Trennung der Adressierung in 

1. externe Adressierung, also die Datentransfers mit exter- 
20 nan Baugruppen 

2. interne Adressierung, also die Datentransfers zwischen. 
PAEs, i.b. zwischen RAM-PAEs und ALU-PAEs 

3. Desweiteren soil die zeitliche Entkoppiung besondere Ber 
achtung finden. ' 

25 • 

Bustransfers werden in interne und externe Transfers zerlegt. 
btl) Externe Lesezugriffe werden separiert, in einer mogli- 
Chen Ausftihrung auch in eirie separate Konf iguratidn (iber- 
setzt. Die Oaten werden von einem externen Speicher in einen 
.30 internen transferiert . 
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bt2) Interne Zugriffe werden mit der Datenyerarbeitung gekop- 
pelt, d.h. die Intemen Speicher werden far die Datenverar- 
beitung gelesen, bzw. beschrieben. 

bt3) Externe Schreibzugrif fe werden separiert, in einer m5g- 
5 lichen Ausftihrung auch in eine separate Konfiguration tiber- 
setzt. Die Daten werden von einem internen Speicher in einen 
externen transferiert. 

Wesentlich ist, dass die btl, bt2, bt3 in unterscheidiiche 
10 Konfigurationen Obersetzt werden konnen und diese ggf. zu ei- 
nem unterschiedlichen Zeitpunkt ausgeftihrt werden. 

Das Verfahren soil an dem nachfolgenden Beispiel verdeutlicht 
werden: 

15 

function example (a, b : integer) -> x : integer 
for 1:= 1 to 100 
•for j := 1 to 100 

x[i] := a[i] * blj] 

20 

Die.Funktion wird vom Compiler in drei Telle, bzw. Konfigura- 
tionen (subconfig) transformiert : 

example#dl6ad:. Lad die Daten von extern (Speicher, Periphe- 
rie/ etc.) und schreibt diese in interne Speicher. Interne 
25 ' Speicher sind mit r# und dem Naraen der urspriinglichen Varia- 
ble gekennzeichnet . 

' example#process : . Entspricht der eigentlichen Datenverarbei- * 
■ tung.. Diese liest die Daten aus internem Operandeh und- 
schreibt die Ergebnisse wieder in interne Speicher. 
. 30 exainpietdstdre ; schreibt die. Ergebnisse aus dem internen 
Speicher nach extern (Speicher, Peripherie, etc.)* 
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function example* (a, b : integer) -> x : integer 
subconfig example#dload 
for i := 1 to 100 

r#a[i] := a[i] 
5 for j := 1 to 100 

r#b(j] := b[j] 

siibconfig examplefprocess 
for i := 1 to 100 
10 for j:= 1 to 100 

r#x[il := r#a[i] * r#b[j] 

subconfig exampletdstore 
■for i := 1 to 100 
15 . x[i] := r#x[i] 

Ein wesentlicher Effekt des Verfahrens ist, dass anstatt i*j 
= 100 * 100 = 10.000 externa Zugriffe nur i+j = 100 + 100 = 
"200 externe Zugriffe zum Lesen der Operanden ausgefiihrt wer- 
20 den. Diese Zugriffe sind zudem noch vollkommen linear, was 
die Transfergeschwindiglce.it bei modernen Bussystemen (Burst) 
und/oder Speichern (SDRAM> DDRAM, RAMBUS, etc) erheblich be- 
schleunigt. 

Die internen Speicher zugriffe erfolgeix parallel, da den Ope- 
25 randen unterschiedliche Speicher zugewiesen wurden. 

Zum Schreiben der Ergebnisse sind i = 100 externe Zugriffe 
notwendig, die ebenfalls wieder linear mit maximaler Perfor- 
mance* erfolgen kanhen,. 

30 Wenn die Anzahl der Datentransf ers vorab nicht bekannt ist 

(z.B. WHILE-Schleifen) Oder sehr grofi ist, kann ein. Verfahren 
verwendet werden, das bei Bedarf durch Unterprogrammaufrufe . 
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die Operanden nachl^d bzw. die Ergebnisse nach extern 
schreibt. Dazu kOnnen in einer bevorzugten Ausfuhrung (auch) 
die Zustande der FIFOs abgefragt werden: 'empty' wenn das FI- 
FO leer ist, sowie 'full' wenn das FIFO voll ist. Entspre- 
S chend der Zustcinde reagiert der Programmflufi . Zu bemerken 
ist, dass bestiramte Variablen (z.B- ai, bi, xi) global defi- 
niert sind, Zu Performanceoptimierung kann ein Scheduler ent- 
sprechend der bereits beschriebenen Verfahren die Konfigura- 
tionen example#dloada, examplettdloadb bereits vor dem Aufruf 
10 von exaniple#process bereits ausfiihren, sodass bereits Daten 
vorgeladen sind. Ebenso kann exainple#dstore (n) nach der Ter- 
minierung von example#process noch .aufgerufen werden um r#x 
zu leer en. 

15 ■ subconfig example#dloada (n) 
while !full{r#a) AND ai<=n 
r#a[ai] := a[ai] 
ai++ 

20 subconfig example#dioadb (n) 
while !full{r#b) AND bi<=n 
r#b[bi] := b[.bi] 

bi++ - ..... 

25 subconfig examplettdstore (n) • 
while !empty(r#x) AND xi<=n 
x[xi] := r#x[xi] 
xi++^ / 

■J 

. 30 subconfig example#process 
for i := 1 to n 
for j:= 1 to ia 
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if empty (r#a) then example#dloada(n) 
if empty (r#b) then example#dloadb (m) 
if full(r#x) then example#dstore(n) 



5 r#x[i] := r#a[i] * r#b[j] 

bj :« 1 

Die Unterprogrammaufrufe und das Verwalten der globalen 
Variablen sind fiir- rekonf igurierbare Architekturen 

10 vergleichsweise aufwendig. Daher kann in einer bevorzugt^n 
Ausfuhrung die nachfolgende Optimierung durchgeftihrt werden, 
in welcher sSmtiiche konf igurationen weitgehend unabangig ab- 
laufen und nach vollstandiger Abarbeitung terminieren (termi- 
nate) , Da die Daten b[j] mehrfach erforderlich sind, mufi ex- 

15 ainple#dloadb entsprechend mehrfach durchlaufen werden. Dazu 
warden beispielsweise zwei Alternativen dargestellt: 
Alternative 1: example#dloadb -terminiert nach jedem Durchlauf 
und wird von example#process fur jeden Neustart neu konfigu- 
riert, 

20 Alternative 2: exampletdloadb lauft unendlich und wird von 
example#process terrainiert. 

Wahrend 'idle' ist eine Konf iguration untatig (wartend) . / 

25 subconfig example#dloada (n) 
for 1:= 1 to n 
while full(r#aj. 

idle 
r#a[i] := a[il 
30 terminate. 



subconfig example #dloadb (n) 
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while 1 // ALTERNATIVE 2 
for i:= 1 to n 
while full(r#b) 
idle 

5 r#b[i] a[i] 

terminate 

subconfig exainple#dstore (n) 
for i:= 1 to n 
10 while empty (r#b) 

idle 
x[i] := r#x[i] 
terminate 



15 subconfig example#process 
for i := 1 to n 
for j 1 to m 

while empty (r#a) or empty (r#b) or full(r#x) 

idle 

20 r#x[i] := r#a[i] * r#b[j] 

config example#dloadb(n) //ALTERNATIVE 1 
■ terminate exampleidloadb (n) // ALTERNATIVE 2 
terminate 

25 . ^ • 

Zur Vermeidung vori Wartezyklen JcSnnen Kbnfigurationen auch 
terminiert werden/ sobald sie ihre Aufgabe temporSr nicht 
weiter erfQllen kGnnen. Die entsprechende Configuration wird 
von dem rekonfigurierbaren Baustein entfernt/. verbleibt je- 
30 ' doch im Scheduler, Hierzu wird im Folgenden der Befehl 'reen 
ter' verwendet. Die relevanten Variablen werden vor der Ter- 
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minierung gesichert und bei der wiederholten Konfiguration 
wiederhergestellt : 

subconfig exaiapletdloada (n) 
5- . for ai:= 1 to n 

if full(r#a) reenter 
r#a[ai] := a[ai] 
terminate 

10 subconfig exainple#dloadb(n) 
while 1 // ALTERNATIVE 2 
for bi:== 1 to n 

if full{r#b) reenter 
r#b[bi] := a[bi] 
15. terminate 

subconfig exampleidstore (n) 
for xi:= 1 to n 



20 



if empty (r#b) reenter 
x[xi3 := r#x[xi] 
. terminate 



'. subconfig example#process 



for i 



:= 1 to n ' 



25 



30 



for j 1 to m 

if empty {r#a) or empty (r#b) or full(r#x) reenter 
r#xCi] := r#a[i] * r#b[j] 
confxQ exampleidloadb (n) // ALTERNATIVE 1 
terminate exampleidloadb (n) // ALTERNATIVE 2 
terminate 
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Zu dem vorstehenden und weiteren sei auf die M5glichkeit hin- 
" gewiesen, erf indungsgemaB einen sogenannten ,,Kontext-Switch^* 
vorzusehen. Hlerzu sel Folgendes angemerkt: 

5 Der wiederholte Start von Konfigurationen, beispielsweise 
,,reenter*^ erfordert das Sichern und Wiederherstellen von lo- 
kalen Daten (z.B. ai, bi, xi) . Bekannte Verfahren nach dem 
Stand der Technik sehen explizite Interface zu Speichern oder 
zu einer CT vor, um die Daten zu transferieren. Samtliche 

10' dieser Verfahren sind inkonsistent und/oder benOtigen zus^tz- 
liche. Hardware. 

Der erf indungsgemaB e Kontext Switch wird derart durchgeftihrt, 
dass eine erste Konf iguration entfernt wird, die zu sichern- 
den Daten verbleiben in den entsprechenden Speichern (REG) 

15 (Speicher, Register, Zahler, etc) , 

Eine zweite Konfiguration wird geiaden, diese verbindet die 
REG in geeigneter Weise und def inierter Reihenf olge mit einem 
Oder mehreren globalen Speicher(n). 
. Die Konfiguration kann beispielsweise Adressgeneratoren ver- 

20 yenden, um auf den/die globalen Speicher zuzugreifen. 

Die Konfiguration kann beispielsweise Adressgeneratoren ver- 
wenden um auf als Speicher ausgestaltete REG zuzugreifen. 
Entsprechend der konf igurierten Verbindung zwischen den REG 
werdeh die Inhalte der REG in einer dqtf inierten Reihenfolge 

25 in den globalen Speicher geschrieben, wobei die jewel ligen 
Adressen von Adressgeneratoren vorgegeben werden. Der Adress- 
generator generiert die Adressen fur den/die globalen Spei- 
cher (n) derart, dass die beschriebenen Speicherbereiche (PUS- 
HAEIEA) der entf ernten ersten Konfiguration eindeutig zugeord- 
. 30 net werden kSiinen. ' 

Mit anderen Worten, es sind bevorzugt fur uriterschiedliche 
Konfigurationen unterschiedliche Adressenraume vorgesehen. 
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Die Konfiguratiqn entspricht einem POSH gew5hnlicher Prozes- 
soren. 

Danach verwenden andere Konfigurationen die Ressourcen. 

5 

Die erste Konfiguration soil wieder gestartet werden. Zuvor 
wird eine dritte Konfiguration gestartet, die die REG der er- 
sten Konfiguration iii einer definierten Reihenfolge miteinan- 
. der verbindet. 

10 Die Konfiguration kann beispielsweise Adressgeneratoren ver- 
wenden urn auf den/die globalen Speicher zuzugreifen. 
Die Konfiguration kann beispielsweise Adressgeneratoren ver- 
wenden um auf als Speicher ausgestaltete REG zuzugreifen. 

15 Ein Adressgenerator generiert Adressen derart, dass ein kor- 
rekter Zugriff auf die der ersten Konfiguration zugeordnete 
PUSHAREA erfolgt. Die generierten Adressen und die konfigu- 
rierte Reihenfolge der REG sind derart, dass die Daten der 
. REG in der ursprtinglichen Ordnung aus den Speichern in die 

20 REG geschrieben werden. Die Konfiguration entspricht einem 
POP gewohnlicher Prozessoren. 

Die erste Konfiguration wird wieder gestartet, 

Zusammengef afit ■ wird ein Kontext Switch derart durchgefahrt, 
■'25 dass durch das Laden besonderer Konfigurationen, die ahnlich 
von PUSH/POP bekannter Prozessorarchitekturen arbeiten, die 
zu sichernden Daten mit einem globalen Speicher ausgetauschen 
werden, 

.30 Es besteht weiter die Moglichkeit , einen besonderen Task- 
Switch bzW. Multikonfigurationshandling vorzusehen.- 
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In einer bevorzugten Arbeitsweise k5nnen unterschiedliche Da 
tenblGcke unterschiedlicher Konfigurationen partitioniert 
werden. Auf diese Partitionen kann zeitoptimiert zugegriffen 
werden, indem beispielsweise wahrend der Ausfuhrung einer 
5 Konf iguration Q ein Teil der Operanden einer nachfplgenden 
Konfiguration P aus externen (Haupt-) Speichern und/oder son- 
stigen (peripheren) Datenstromen in die internen Speicher 
vorgeladen werden und wShrend der Ausfuhrung von P die Ergeb- 
nisse von Q als Teil des Gesamtergebnisses aus den internen 
10 Speichern an externe (Haupt--) Speicher und/oder sonstige (pe- 
ripheren) DatenstrCme geschrieben werden. 

Die Funktionsweise unterscheidet sich erheblich von der in 
US6,341,318 beschriebenen. Ein Datenstrom oder Datenblock 
wird bevorzugt durch eine FIFO-Struktur entkoppelt (z.B, 10- 
15 FIFO) . Unterschiedliche Datenstrome oder Datenblocke insbe- 
. sondere unterschiedlicher Konfigurationen werden bevorzugt 
durch unterschiedliche Speicher und/oder FIFO-Bereiche 
und/oder Zuordnungsmarkierungen in den FIFOs entkoppelt. 

20 Die zuvor beschriebenen optionalen MMU-Verf ahren konnen zum 
Entkoppein und. Puf fern externer Daten verwendet werden. 
In einer Anwendungsweise kann ein groBer externen Datenblock 
in. mehrere Segment e zerteilt werden, die jeweils innerhalb 
einer VPU verarbeitet werden konnen. 

25 In einer zusatzlichen bevorzugten Arbeitsweise konnen unter- 
schiedliche Datenblocke unterschiedlicher Konfigurationen 
entsprechend des vofstehend erklarten Verfahrens in Partitio 
.nen zerteilt werden, die nurimehr als Pages fur eine MMU defi 
niert werden. Auf diese kann .zeitoptimiert zugegriffen wer- 

30 den, indem beispielsweise wahrend der Ausfuhrung einer Konfi 
guration Q im PA die Operanden einer nachfolgenden Konfigura 
tion P als Page aus externen (ttaupt-) Speichern und/dder son- 
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stigen (peripheren) Datenstr5men in die internen Speicher 
vorgeladen werden und wShrend der AusfOhrung von P die Ergeb- 
nisse von Q als Page aus den internen Speichern an externe 
(Haupt-) Speicher und/oder sonstige (peripheren) Datenstrome 
5 geschrieben werden. 

FQr die vorstehenden Verfahren werden bevorzugt interne Spei- 
cher/ die mehrere Partitionen bzw. Pages verwalten kSnnen 
eingesetzt-^ 

10 Die Verfahren konnen fUr PAE-RAMs und/oder Collector-Speicher 
eingesetzt werden. 
. Bevorzugt werden Speicher mit mehrere Businterfaces verwendet 
(multi-port), um einen gleichzeitigen Zugriff von MMUs 
und/oder des PAs und/oder weiterer Adressgeneratoren/ Daten- 

15 transfereinrichtungen zu ermoglichen. 

In einer Ausgestaltung werden Kennungen bei den Datentrans- 
fers mitubertragen, die eine Zuordnung von Daten zu einer 
Resssource und/einer Applikation ermoglichen. Beispielsweise 
20 kann das in DE 101 10 530.4 beschriebene Verfahren angewendet. 
werden. Unter3chiedliche Kennungen konnen auch gleichzeitig 
verwendet werden. 

In einer besonders bevorzugten Ausf tihrung wird eine Applika- 
tionskennungen (APID) bei jedem Datentransfer mit den Adres- 

25 sen und/oder Daten .mi tiibertragen. Eine Applikation besteht 
aus mehreren Konf igurationen-. Anhand der APID werden die 
abertragenen Daten einer Applikation b^w. den fiir eine Appli- 
' kation bestimmte Speichern oder anderen Ressourcen (z.B. 
.PAEs, Busse, etc) zugewiesen. Zu diesem Zweck konnen die . 

30 APIDs unterschiedlich verwendet werden. 

Beispielsweise koniien Interf ace-Baugruppen entsprechend von 
APIDs selektiert- werden- • 
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Beispielsweise kdnnen Speicher entsprechend von APIDs selek- 
tiert werden. 

Beispielsweise konnen PAEs entsprechend von APIDs selektiert 
■ werden. 

5 Beispielsweise konnen Speichersegmente in internen Speichern 
(z.B. PAE-RAMs, Collector (en) ) durch APIDs zugewiesen werden. 
Dazu k5nnen die APIDs ahnlich eines Adressteils in eine einem 
internen Speicher zugeordneten TLB eingetragen werden, womit 
ein bestimmter Speicherbereich (Page) abhangig von einer APID 

10 zugewiesen und selektiert wird. 

Durch dieses Verfahren entsteht -die Moglichkeit, Daten unter- 
schiedlicher Applikationen innerhalb einer VPU effizient zu 
verwalten und auf diese zuzugreifen. 

Optional besteht die Moglichkeit, explizit Daten bestiiranter 
15 APIDs zu loschen (APID-DEL) und/oder an externe (Haupt- 
) Speicher und/oder sonstige (peripheren) Datenstrome zu 
schreiben (APID-FLUSH) . Dies kann jeweils erfolgen, wenn eine 
Applikation terminiert. APID-DEL und/oder APID- FLUSH konnen 
durch eine Konf iguration und/oder durch eine tibergeordnete 
20 Ladeeinheit (CT) und/oder von extern ausgelost werden. 

' Das folgende Verarbeitungsbeispiel soil das Verfahren ver- 
deutlichen: 

Eine Applikation Q (z.B. APID = Q) kann aus einer Konfigura- 
25 tion zum Lesen der Operanden (z.B. ConfigID = j), einer Kon- 
f iguration zum Verarbeiten der Operanden (z.B. ConfigID = 
w)und einer Konf iguration zum Schreiben den Ergebnisse (z.B. 
ConfigID = s) besteTien. ' 

Die Konf iguration j wird zuerst ausgeftihrt, um'zeitlich opti- 
30 mal ehtkoppelt die Operanden zu lesen. Gleichzeitig kOnnen 
Konfigurationen andefer Applikationen aiisgefahrt werden. Die 
' Operanden werden entsprechend der Kennung APID aus externen 
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{Haupt-)Speichern und/oder sonstigen (peripheren) Datenstr6- 
men in bestiramte interne Speicher und/oder Speicherbereiche 
geschrieben. 

Die Konfiguration w wird ausgeftihrt, um die gespeicherten 
5 Operanden zu ver^rbeiten. Dazu wird unter Angabe von APID auf 
die entsprechenden Operanden in den internen Speichern 
und/oder Speicherbereiche zugegriffen, Ergebnisse werden ent- 
sprechend unter der Angabe von APID in interne Speicher 
und/oder Speicherbereiche geschrieben. Gleichzeitig konnen 

10 Konfigurationen anderer Applikationen ausgeftihrt werden. . 
Abschliefiend schreibt die Konfiguration s die gespeicherten 
Ergebnisse aus den den internen Speichern und/oder Speicher- 
bereiche an externe (Haupt-) Speichern und/oder sonstige (pe- 
ripheren) Datenstrome. Gleichzeitig konnen Konfigurationen 

15 anderer Applikationen ausgeftihrt werden. 

' Insoweit entspricht der Grundablauf des Verfahrens dem vorab 
beschriebenen zur Optimierung von Speicherzugrif f en. 

Sind Daten fUr eine bestimmte APID nicht in den Speichern 
20. vorhanden oder ist kein Speicherplatz fQr' diese Daten mehr 
frei/ kann ein Pagefault zur Obertragung der Daten ausgelost 
werden. 

WShrend vorstehend zunachst von einem 3austein ausgegangen 
25 wurde, bei dem ein Feld rekonfigurierbarer Elemente mit al- 
lenfails geririger zusatzlicher Beschaltung wie Speichern^ FI- 
FOs und dergleichen vorgesehen wird, ist es, auch moglich, die 
erfindiingsgemaBen Ideen zu Verwenden fiir Systeme, die als 
,,systems on a qhip"^* (SoC) bezeichnet' werden. Fur SoCs sind 
. 30 die Begriffe ^intern"" und ^extern"" riicht vollstandig in ihrer. 
herkommlichen Terminologie anwendbar, etwa wenn beiapielswei- 
se eine VPU mit weiteren Baugruppen (z.B. Peripherie, andere 
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Prozessoren und Insbesondere Spelchern) au£ elnem elnzigen 
Chip gekoppelt bzw. veykoppelt sind. ^Es kann dann folgende 
Begrif f sdef inition' gelten^ wobei ersichtlich sein wlrd, dafi 
diese nicht schutzbeschrankend aufzufassen ist^ sondern nur 

5* beispielhaft angibt^ wie sich die Ideen der vorliegenden Er- 
findung unproblematisch auf Konstrukte lesen lassen, die her- 
kGmmlich eine andere Terminologie verwenden: 
• intern: Innerhaib einer VPO Architektur, bzw.. zur VPU Archi- 
tektur und IP gehorende Bereiche 

10 extern: AuBerhalb einer VPU Architektur, d.h- alle sonstigen 
Baugruppen z.B. Peripherie, anderen Prozessoren und i.b. 
Speicher) auf einem SoC und/oder aufierhalb des Chips in dem 
. sich die VPU Architektur befindet. 

15 Es sei nun eine bevorzugte Ausgestaltung beschrieben: 

In einer besonders bevorzugten Ausgestaltung werden datenver- 
arbeitenden PAiss lokal im PA (z.B.. ALUs, Logik, etc.) ange- 
. ordnet und verknupft. RAM-PAEs kCnnen lokal im PA eingebunden 

20 sein, sind allerdings in einer be'sonderg bevorzugten Ausge- 
staltung von dem PA abgesetzt oder an dessen RSndern ange- 
bracht (vgl. DE 100 50 442.6). Dies erfolgt, urn die Homogeni- 
tat des PA bei groBen RAM-PAE Speichern, deren Flachenbedarf 
weit grolier als der von ALU-PAEs ist, .^licht zu storen und. 

25 aufgrund eines fiir gewohnlich stark unterschiedlichen Gat- 

ter /Transistor-Layouts (z.B. GDS2) von Speicher zellen, Sofern. 
die RAM-PAEs dedizierte Anschiasse an ein externes Bussystem 
(z.B. globaler Bus) aufweisen, sind sie aus Layout-, Floor- 
plan- und Herstellungs-Griinden bevorzugt an den Randern eines 

30 PA angeordnet. 

Typischerweise wird zur physikalischen Anbiridung das konf igu- 
rierbare Bussystem des PA verwendet. 
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In elner erweiterten Ausgestaltung welsen PAEs und Interface- 
Baugruppen, sowle ggf . weitere konfigurlerbare Baugruppen ei- 
nen dedlzierten Anschlufi an elnen dedlzlerten globalen Bus 
z.B. einen GlobalTrack auf. 

5 

Interface-Baugruppen und insbesondere Protokollkonverter war- 
den bevorzugt vom PA abgesetzt und ausserhalb derer Anordnung 
plaziert. Dies erfolgt/ um die Homogenitat des PA nicht zu 
stCren und auf grund eines f Ur gewohnlich stark unterschiedli- 

10 Chen Gatter /Transistor-Layouts {z.B. GDS2) des Interface- 

Baugruppen/Protokollkonverter. Desweiteren sind die Anschliis- 
se an externe Einheiten aus Layout-, Floorplan- und Herstel- 
lungs-GrQnden bevoi^zugt an den Randern eines PA angeordnet. 
Die Anbindung der Interface-Baugruppen an das PA erfolgt be- 

15 vorzugt Uber das konfigurierbare Bussystem der PA,. an dessen 
aulieren RSndern die Interface-Baugruppen angebunden werden. 
Das Bussystem erlaubt konf iguirierbar den Datenaustausch zwi- 
schen Interface-Baugruppen und beliebigen PAEs innerhalb des 
PA; mit ajideren Worten innerhalb einer oder unterschiedlicher 

20 Konf igurationen konnen Interface-Baugruppen' z.B. mit RAM-PAEs 
verbunden sein, andere Interface-Baugruppen konnen beispiels- 
weise mit ALU- PAEs verbunden sein. 

Die lO-FIFOs werden bevorzugt in das Protokollkonverter inte- 
griert. Dm eine hohere Flexibilitat in der Zuordnurig der in- 
25 ; ternen Datenstrome an die externen zu ermogl.ichen, sind die 
Interface-Baugruppen und Protokollkonverter getrennt ausge- 
staltet urid mittels eines konfigurierbare Bussystems verbun- 
den. 

. 30 Die Erfindung wird im Folgenden nur beispielsweise in nicht 
limitierender Weise unter Bezugnahme auf die Zeichnung noch 
. einmal eriautert . 
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Figur 1 zeigt einen besonders bevorzugten Aufbau eines rekon- 
figurierbaren Prozessors, bestehend aus einem Kern (Array PA) 
(0103) beispielsweise bestehend aus einer Anordnung von ALU- 

5 PAEs (0101) (zur Durchfuhrung von Berechnungen) und RAM~PAEs 
(0102) (zuiti Speichern) und entspricht damit dem Grundprinzip 
nach DE 196 54 846.2. Wie bevorzugt befinden sich die RAM- , 
PAEs nicht lokal im Kern integriert, sondern von den ALU-PAEs 
abgesetzt an den Randern oder ausserhalb des Kerns. Dies er- 

10 folgt, um die Homogenitat des PA bei grofien RAM-PAE Spei-- 
chern^ deren Flachenbedarf weit grower als der von ALU-PAEs 
ist, . nicht zu st5ren und aufgrund eines fur gewohnlich stark 
unterschiedlichen Gatter/Transistor-Layouts (z.B. GDS2) von 
Speicherzellen- Sofern die RAM-PAEs dedizierte Anschliisse an 

15 ein externes Bussystem (z.B. dediziter globaler Bus; Global- 
Track; etc.) aufweisen, sind aus Layout-, Floorplan- und Her- 
stellungs-GrUnden bevorzugt an den Render n eines PA angeord- 
net. 

Die einzelnen Einheiten sind Ober Bussysteme (0104) miteinan- 
20 der verbiinden. An den Randern des Kernes befinden sich Inter- 
facebaugruppen (Interf'ace-Baugruppen und ggf . Protokollkon- 
verter) (0105) ahnlich DE 196 5.4 595.1 zu externen Bussen 
(10) • Die Interfacebaugruppen konnen implementierungsabhangig 
unterschiedlich ausgestaltet sein und ..beispielsweise eine 
25 Oder . mehrere der .folgenden Funktionen erfiillen: 

' 1. Zusairimenfuhren und synchronisieren von mehreren Bussy- 
stemen, um beispielsweise Adressen und Daten zu synchro- 
nisieren 

2. Adressgeneratoren und/oder DMAs 
30 3. FIFO Stufen zur Entkopplung der Daten und/oder Adressen 
4. Inter facecontrollern (z,B. far AMBA-Bus, RAMBUS, 
RapidIO, OSB, DDRRAM, etc) 
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Figur 2 zeigt unterschiedliche Ausgestaltung det erfindungs- 
gemafien Architektur, 0201 stellt eine Anordnung von ALD-PAEs 
(PA) dar, die mit mehreren RAM- PAEs (0202) gekoppelt sind. 
5 Ober FIFOs (0203) sind externe Busse (10) (0204) angeschlos- 
sen . 

Figur 2a zeigt eine direkte FIFO zu PA Kopplung. 

10 In Figur 2b ist die 10 (0204) uber die RAM-PAEs (0202) mit 
0201 verbunden. Die Verbindung erfolgt dabei typischeweise 
Uber das konf igurierbare Bussystem 0104 oder ein dediziertes 
Bussystem. Multiplexer/Demultiplexer (0205) schalten eine 
Vielzahl von Bussen. (0104) auf die 10 (0204). Die Multiplexer 

15 werden durch eine Konf igurationslogik und/oder Adressselek- 
tierlogik und/oder einen Arbiter (0206) angesteuert.. Die An- 
steuerung der Multiplexer kann beispielsweise auch durch das 
PA erfolgen. 

20 Figur 2c entspricht Figur 2b, jedoch sind vor die 10 noch FI- 
FOs (0203) .geschaltet/ 

. Die Darstellungen in den Figuren 3 entsprechen den Figuren 2, 
.weshalb dieselb'eh Refelrenzen verwendet. sind. Figur 3 verdeut- 
25 . lich das bevorzugte Dateriverarbeitungverfahren in einer VPO. 
• Figur 3a: Daten gelangen Ober die 10 (0204) in eljien Ein- 
gangs-FIFO (0303 entsprechend 0203) und werden von diesem in 
das PA (0201) und/oder. zuvor in Speicher 0202 geladen. 

30 Die Figuren 3b-e zeigen die . Datenausfiihrung, bei welcher Da- 
ten zwischen. den Speichern libertragen werden. Wahrend dieser 
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Zeit k5nnen die FIFOs weiterhin Eingangsdaten (0301) und/oder 
Ausgangsdaten (0302) tlbertragen. 

In Figur 3f wefden Daten aus dem PA und/oder aus den Spei- 
5 chern in in den Ausgangs-FIFO (0304) geladen. 

Es soli nochmals darauf hingewiesen werden, dass das Einlesen 
von Daten aus dem Input-FIFO in die RAM-PAEs oder 0201 und 
das Schreiben von Daten aus 0201 oder den RAM-PAEs zeitgleich 
10 geschehen kann. 

Ebenfalls soil darauf hingewiesen werden, dass die Input- 
/Output-FIFOs wahrend der Schritte a-f kontinuierlich externe 
Daten empfangen bzw. senden konnen. 

15 Figur 4 zeigt dasselbe Verfahren in einer leicht modifizier- 
ten Fassung, bei welcher Multiplexer/Demultiplexer (0401) zur 
einfachen Datenverteilung zwischen die FIFOs und 0201 ge- 
schaltet sind. Die Multiplexer werden durch eine Konfigurati- 
onslogik und/oder Adressselektierlogik und/oder einen Arbiter- 

20 (0402) angesteuert. 

Mehrere Konfigurationen finden fiir die Datenverarbeitung 
statt (a-e) . 

Die Daten konnen aus den FIFOs (Input-FIFOs) in Speicher 
und/oder direkt (0403) in das PA eingelesen werden. Wahrend 
25 des Einlesevorganges konnen Daten aus dem PA und/oder Spei- 
Ghern in FIFOs ( Output r FIFOs) geschrieben werden (0404) . Zur 
Datenausgabe konnen Daten aus den Speichern und/oder direkt 
(0405) aus dem PA an die FIFOs geschrieben werden- Wahrend- 
dessen kdnnen rieue Daten aus den Input-FIFOs an Speicher 
.30 und/oder das PA geschrieben (0406) werden- 

Das Einschreiben neuer Daten (0407)- kann beispielsweise be- 
reits wahrend einer letzten Konfiguration erfolgen. 
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wahrend der gesamten Verarbeitung konnen Daten von extern in 
die Input-FIFOs Obeftragen (0408), bzw. von den Output-FIFOs 
nach extern Obertragen (0409) werden. 

5 Figur 5 zeigt eine mSgliche Ausgestaltung einer PAE, Ein er- 
stes Bussystem (0104a) ist mit einer Datenverarbeitungeinheit 
(0501) verbunden deren Ergebnisse auf ein zweites Bussystem 
(0104b) tibertragen werden. Der vertikale Datentransfer wird 
tiber zwei Register-/Multiplexerstufen (FREG 0502, BREG 0503) 

10 mit je unterschiedlicher Obertragungsrichtung gefiihrt. In die 
FREG/BREG kannen bevorzugt einfache ALUs beispielsweise fUr 
Addition, Subtraktion und Multiplexoperationen integriert 
sein, Ober ein zusatzliches Interface (0504) wird die Einheit 
in ihrer Funktion und Vernetzung von einer Konf igurationsein- 

15 heit (CT) konfiguriert, in einer bevorzugten Ausgestaltung 
besteht die Moglichkeit Konstanten in Register und/oder Spei- 
cher fiir die Datenverarbeitung zu setzen. In einer weiteren 
Ausgestaltung kann eine Konf igurationseinheit (CT) Daten aus 
den Arbeit sregis tern und/oder Speichern auslesen. 

20 In einer erweiterten Ausgestaltung kann eine PAE zusatzltch 
einen AnschluB an einen dedizierten globalen Bus (0505) (z-B, 
einen GlobalTrack) aufweisen und damit beispielsweise direkt 
mit einem globalen ggf . auch externen Speicher und/oder Peri- 
pherie koitununizieren. Desweiteren kanix ein globale Bus derart 

25 ausgestaltet sein^ dass unterschiedliche PAEs direkt uber 
diesen miteinander und in einer bevorzugten Ausfiihrung auch 
mit Baugruppen fUr einen externen Anschlufi (z.B. Interface- 
Baugruppen) kommunizieren kCnnen. Ein Bussystem wie bei- 
spielsweise in DE 197 04 742.4 beschrieben kann fur derartige 
.30 Zwecke eingesetzt werden. 
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Die Datenverarbeitungelnheit (0501) kann beispielswelse fttr 
ALU-PAEs als arithmetisch logische Einheit (ALU) ausgestaltet 
seln. Unterschiedliche ALU-PAEs kannen unterschiedllche ALUs 
und Busaufschaltsysteme verwenden. Beispielswelse kann eine 
5 .ALU mehr als 2 Busverbindungen zu 0104a und/oder 0104b auf- 
weisen. 

Die Datenverarbeitungelnheit (0501) kann beispielswelse fUr 
RZVM-PAEs als Speicher ausgestaltet sein. Unterschiedliche 

10 RAM-PAEs kdnnen unterschiedliche Speicher und Busaufschaltsy- 
steme verwenden. Beispielswelse kann ein Speicher mehrere 
i.b. mehr als 2 Busverbindungen zu 0104a und/oder 0104b auf- 
weiseri urn beispielswelse den Zugriff mehrere Sender/Empf anger 
auf einen Speicher zuzulassen- Die Zugriff e konnen bevorzugt 

15 auch gleichzeitig erfolgen (Multi-Port) . 

Die Fiinktion des Speichers lamfaJit beispielswiese folgende 
Funktionen Oder Kombinationen daraus; Random Access, FIFO, 
Stack, Cache, Page Memory mit MMU-Verfahren. 

Desweiteren kann in einer bevorzugten Ausfuhrung der Speicher 
20 mit Oaten von der CT vorgeladen werden (z.B. Konstanten, Loo- 
kup-Tabellen, etc) . Ebenf alls kann die CT in einer erweiter- 
ten Ausfahrung Daten (z.B, zum Debuggen oder fUr Taskwechsel) 
aus dem Speicher iiber 0504 zuriicklesen. 

In einer weiteren Ausfdhrung kann die ,.RAM-PAE einen dedizier-. 
25 ten AhschluB (0505) an einen globalen Bus aufweisen^ Der glo- 
bale Bus verbindet mehrere PAEs unteireinander und in einer 
bevorzugten Ausfuhrung auch mit Baugruppen ^ur einen externen 
Anschlufi (z.B. InterfaCe-Baugruppen) . FQr ein derartiges Bus- 
system kann das in DE 197 04 742.4 beschriebene System ver- 
.:30 , wendet werden. . 

RAM-PAEs kannen derart zusammengeschaltet werden, dass aus 
mehreren (n) RAM-PAEs ein n-fach grSBerer Speicher entsteht. 
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Figur 6 zeigt eine beispielhafte Verschaltung von ALO-PABs 
(0601) und RAM-PAEs (0602) tiber Bussysteme 0104. Eine bevor- 
zugte Verschaltung far einen rekonfigurierbaren Prozessor ist 
5 in Figur 1 dargestellt. 

Figur 7 zeigt eine einfache Ausgestaltungsvariante einer 10- . 
Schaltung entsprechend 0105- Es werden Adressen (ADR) und Da- 
ten (DTA) zusammen' mlt Synchronisationsleitungen • (RDY/ACK) 
10 zwischen den internen Bussystemen (0104) und elnem externen 
Bussystdmen (0703) dbertragen. Das externe Bussystem fahrt 
beispielsweise zu lO-FIFOs und/oder Protokollkonvertern. , 

Figur 7a zeigt eine Schaltung zum Schreiben von Oaten, die 
15 von 0104 .eingehenden Adressen und Oaten werden miteinander 
verknUpft (0701) . In der Interf aceschaltung (0701) kann eine 
FIFO-Stufe zur Entkopplung zwischen 0104 und 0703 vorgesehen 
sein. 

20 Figur 7b zeigt eine Schaltung zum Lesen von Oaten, bei wel- 
cher eine Quittierungschaltung (0702, z,B. FIFO, Zahler) fur 
■die .Abstimmuhg der ausgehenden Adressen mit den eingehenden 
Oaten vorgesehen ist'. In 07bla und/oder in 0701b kann eine 
FXFO-Stufe zur Entkopplung zwischen 0104 und 0703 vorgesehen 

25 sein. Sofern in 0701b eine FIFO-Stufe vorgesehen ist, kann 
diese auch fur die Quittierungschaltung 0702 mitverwendet 
werden . 

Figur 8 zeigt eine mogliche Verbindungsstruktur zwischen In.- 
30 terface-Baugruppen und/oder PAEs mit dediziertem globalen Bus 
(0801) und Protokollkonvertern (0802) zu externen (Haupt- 
)[Speichern und/oder sonstigen (peripheren) Datenstromeri. Die 
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Interface-Baugruppen sind mit einem PA, vorzugsweise ilber de- 
ren Netzwerk entsprechend 0104 verbunden (0803) . 
Zwischen Interface-Baugruppen und/oder PAEs mit dediziertem 
globalen Bus (0801) und Protokollkonvertern (0802) ist ein 
5 Bussystem (0804ar 0804b) vorgesehen. 0804 kann in einer be- 
vorzugten Ausgestaltung Daten tiber mehrere Registerstufen ge- 
pipelinet (jbertragen. 0804a und 0804b werden tiber Schalter 
(z.B. 0805), die beispielsweise als Transmission Gates 
und/oder Tristate-Buf far und/oder Multiplexer ausgestaltet 

10 sind, miteinander verschaltet. Die Multiplexer werden zeilen- 
/spaltenweise angesteuert- Ansteuereinheiten (0806) steuern 
den Datentransfer der Interface-Baugruppen. und/oder Pl^s mit 
dediziertem globalen Bus (0801) an die Protokollkonverter 
(0802), also die Transferrichtung 0804a and 0804b. Ansteuer- 

15 einheiten (0807) steuern den Datentransfer der Protokollkon- 
verter (0802) auf die Interface-Baugruppen und/oder PAEs mit 
dediziertem globalen Bus (0801), also die Transferrichtung 
0804b an 0804a, Die Ansteuereinheiten (0806) dekodieren je- 
weils Adressbereiche zur Selektlon der Protokollkonvertern 

20 (0802), die Ansteuereinheiten (0807) dekodieren jeweils lOIDs 
. zur Selektion der Interface-Baugruppen und/oder PAEs mit de- 
diziertem globalen Bus (0801) . 

•Ansteuereinheiten konnen nach unterschiedlichen Ansteuerarten 
arbeiten, z.B, Feste Verbindung ohne D^ekodierung; Dekodierung 

■25 von Adre's sen und/oder lOIDsr Dekodierung von Adressen 

und/oder lOIDs und Arbitrierung. Ein oder mehrere Daten- 
/Adressworte k5nnen pro. Arbitrierung ubertragen werden. Die 
Arbitrierung kann nach unterschiedlichen Regeln erfolgen. 
Die Interface-Baugruppen konnen bevorzugt einen kleinen FIFO 

^ 30 fur Adressen. und/oder Daten in Ausgangs- und/oder Eingangs- 
richtung aufweisen, Eine besondere Arbitrierungsregel arbi- 
tiert bevorzugt eine Interface-Baugruppe iriit beispielsweise 
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vollem (FULL) Oder leerem (EMPTY) Oder zu leerendem (FLUSH) 
. FIFO. 

Ansteuereinheiten kSnnen beispielsweise nach DE 199 26 538.0 
Fig. 32 aufgebaut sein, Diese Ansteuereinheiten k5nnen fQr 
5 0807 Oder 0806 verwendet werden. Bei Verwendung als 0806 en- 
spricht 0812 0804a und 0813 entspricht 0804b. Bei Verwendung 
als 0807 enspricht 0812 0804b und 0813 entspricht 0804a. 
Dekoder (0810) dekodieren die Adressen/IOIDs der eingehenden 
Busse (0812) und steuern einen Arbiter (0811) an, der wieder- 
10 um die eingehenden Busse Ober einen Multiplexer auf einen 
Ausgangsbus (0813) schaltet. 

Die Protokollkonverter sind an externe Bussysteme (0808) ge- 
koppelt, wobei mehrere Protokollkonverter auf demselben Bus- 
system (0809) aufgeschaltet sein konnen, wodurch sie dieselr 

15 ben externen Ressourcen nutzen konnen. 

In den Protokollkonvertern sind bevorzugt die lO-FIFOs inte- 
griert, denen bei Bedarf ein FIFO (BURST-FIFO) fUr die Steue- 
* rung von Bursttransfers fur die externen Busse (0808) nachge 
schaltet ' ist. In einer bevorzugten Ausgestaltung ist den FI- 

2a FOs eine weitere FIFO-Stufe (SYNC-FIFO) zur Synchronisation 
der ausgehenden Adress'en mit den eingehenden Daten nachge-* 
schaltet; 

Verschiedene jeweils prograininierbare/konf igurierbare FIFO- 
Strukturen sind in 0820-0823 dargestellt. A kennzeichnet die 

25 . • Lauf richtung eines Adress-FIFOs, D die Laufrichtung eines Da 
ten-FIFOs- Die DatenUbertragungsrichtung der FIFOs ist abhan 
gig von der Datenilbertragungsrichtung und Betriebsart. 
/ Arbeitet eine VPU als Busmaster, werden bei einem Schreibzu- 
griff (0820) Oaten und Adressen von intern auf den externen 

30 Bus ubertragen, bei einem Lesezugriff (.0821) werden Adressen 
von intern nach extern und Daten von extern nach intern uber 
• tragen. 
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Arbeitet eine VPU als Busslave, werden bei.einem Schreibzu- 
griff (0822) Daten und Adressen von den externen Bus nach in- 
tern (ibertragen, bei einem Lesezugriff (0823) werden Adressen 
von extern nach intern und Daten von intern nach extern Uber- 
5 tragen. . 

Bei s3xntlichen Datentransfers kdnnen Adressen und/oder Daten 
lOIDs und/od(Br APIDs zugeordnet und in den FIFO-Stufen mit 
gespeichert werden. 

In einer besonders bevorzugten Ausgestaltung kann durch die 
10 Ehtkopplung der Datentransfers durch die jeweiligen FIFO- 
Stufen/ der Transferrate (Arbeit sfrequenz) der Bussysteme 
0104/ 0804 und 0808/0809 jeweils unterschiedlich sein- Insbe- 
sondere kSnnen die externen Bussysteme (0808/0809) beispiels- 
weise mit einer * hdheren Transferrate arbeiten als die inter- 
15 nen Bussysteme (0104) und/oder (0804). 

Figur 9 zeigt einen mSglichen Ablauf eines Datenlesetransf ers 
tiber die SchaJ,tung nach Figur 8, 

Adressen (vorzugsweise Kennungen wie z.B. mit lOIDs und/oder 
20 APIDs) werden iiber das interne Bussystem 0104 an Interface- 
Baugruppen und/oder PAEs mit dediziertem globalen Bus Uber- 
tragen, die vorzugsweise einen internen FIFO (0901) aufwei- 
sen- Ober ein Bussystem (z.B. .0804) das bevorzugt gepiplinet 
(0902) arbeitet/ werden die Adressen in einen lO-FIFO (0903) 
25 dbertragen. (Jber einen weiteren Bus (0904), der gepipelinet 
aufgebaut. sein kann aber vorzugsweise kurz' und lokal ist wer- 
■ den die Adressen in/einen BURST-FIFO (0905) iibertragen. Das 
BURST-FIFO dient der korrekten Abwicklung von Bursttransf ers 
iiber das externe Bussystems, beispielsweise zur Steuerung von 
30 Burst-Adressen und -sequenzen und der Wiederholung von Burst- * 
zyklen bei auf getretenen Fehlem. lOIDs und/oder APIDs von 
Adressen (0906) die iiber das externe Bussystem iibertragen 
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werden, k5nnen mit den Adressen mitttbertragen werden und/oder 
in einem zusStzlichen SYNC-FIFO (0907) gespeichert werden. 
Das SYNC-FIFO gleicht die Latenzzeit zwischen ausgehender 
Adresse (0906) und eingehenden Daten (0909) aus. Eingehenden 
5 Daten k5nnen lOIDs und/oder APIDs (0908) der sie referenzie- 
renden Adressen ttber das SYNC-FIFO zugeordnet werden (0910) . 
Die Daten (und yorzugsweise lOIDs und/oder APIDs) werden in 
einem lO-FIFO (0911) gepuffert und werden danach tiber ein 
Bussystem (z.B* 0804) das bevorzugt gepiplinet (0912) arbei- 
10 tet an eine Inter face-Baugruppe und/oder PAE mit dediziertem 
globalen Bus (0913) iibertragen^ die bevorzugt einen internen 
FIFO beinhaltet. Von dieser werden die Daten an das interne 
Bussystem (0104) weitert3±>ertragen. 

Optional konnen eingehende Daten anstatt in den lO-FIFO 
15 (0911) zunachst ih einen nicht eingezeichneten zweiten BURST- 
FIFO geleitet werden, der sich entsprechend des BORST-FIFOs 
0905 verhalt, sofern ein Burst-Error-Recovery auch bei Lese- 
. zugriffen erforderlich ist. Danach werden die Daten an 0911 
weitergeleitet . 

20 

Figur 10. entspricht prinzipiell Figur 8^ weshalb dieselben 
Referenzen verwendet wurden. Es wurden in dieser beispielhaf- 
ten Ausgestaltung weniger Xnterface-Baugruppen und/oder PAEs 
mit dediziertem globalen Bus (0801) und weniger Protokollkon- 

25 verter (0802) zu externen (Haupt-) Speichern und/oder sonsti- 
gen (peripheren) DatenstrOmen eingezeichnet. ZusStzlich wurde 
ein Collector (1001) eingezeichnet/ der derart an die Bussy- 
steme 0804 ang.eschlossen ist, dass Daten von den Interface- 
Baugruppen und den Protokpllkonvertern in. den Collector ge- 

•30 schrieben und/oder aus diesem gelesen werden konnen. Ober die 
Ansteuereinheit 1007, die 0807 entspricht wird der Collector 
auf die 0804a Bussysteme aufgeschaltet, uber die Ansteuerein- 
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heit 1006, die 0806 entspricht wird der Collector auf die 
0804b Bussysteme aufgeschaltet . 

Mehrere Collectoren k5nnen implementiert seln, wozu mehrere 
Ansteuereinheiten 1006 und 1007 verwendet werden. 
5 Ein Collector kann in mehrere Speicherbereiche segmentiert 
sein* Jeder Speicherbereich f(ir sich kann in unterschiedli- 
Chen Speichermodi arbeiten, beispielsweise als Random Access 
Speicher, FIFO, Stack, Cache, MMU Page etc. 
Einera Collector kann eine Obersetzungistabelle (TLB) (1002) 
10 zugeordnet sein, iim eine MMU-artigen Betriebsart zu ermSgli- 
chen. Die Seiten (Page) Verwaltung kann beispielsweise anhand 
von Segmentadressen und/oder. sonstigen Kennungen wie bei- 
spielsweise APIDs und/oder lOIDs arbeiten. 

Vorzugsweise ist einem Collector eine DMA oder mehrere DMAs 
15 zugeordnet, urn Datentransfers mit externen (Haupt-) Speichern 
und/oder sonstigen (peripheren) DatenstrOmen durchzuftthren, 
insbesondere urn die MMU-Funktion der Pageverwaltung (laden, 
schreiben) von Pages automat isch zu erm5glichen. DMAs konnen 
2ur .Adressubersetzung zwischen externen (Haupt-) Speichern 
20 und/oder sonstigen (peripheren) Datenstroraen und Collector 
ebenfalls auf die TLB zugreifen. DMAs kdnnen'in einer mogli- 
chen Arbeitsweise Adressvorgaben aus dem Array (PA) erhalten, 
beispielsweise iiber 0804. 

DMAs konnen durch eine oder mehrere der f olgenden Einheiten 
25 angesteuert werden: Einer dem Collector zugeordneten MMU bei- 
spielsweise im Falle von Pagefaults; dem Array (PA); einem 
■ externen Bus (z.B. 0809); einem externen Prozessor; einer 
ubergeordneteri Ladeeinheit (CT) . 

Collpctoren konnen Zugirif f auf ein dediziertes und bevorzugt 
; 30 auch DMA-gesteiiertes sowie. bevorzugt Master/Slave fahiges 

Businterface (1004) mit Protokollkonverter entsprechend oder 
ahnlich den Protokollkonverterh 0802 zu externen 
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(Haupt-)Speichern und/oder sonstigen (peripheren) Datenstrd- 
men besltzen. 

Ein externer Prozessor kann direkten Zugriff auf Collectoren 
haben (1007) . 

5 

Figur 11 entspricht prinzipiell Figur 9/ weshalb dieselben 
Referenzen verwendet wurden. In den Datenstrom integriert ist 
ein Collector (1101) itiit zugeordneter Transf ersteuerung (z,B. 
DMA bevorziigt mit TLB) (1102). Das Array (PA) transferiert 

10 Daten nuninehr bevorzugt mit dem Collector (1103) • Dieser 

tauscht die Daten bevorzugt weitgehend selbstandig (iber 1102 
gesteuert mit externen (Haupt-) Speichern und/oder sonstigen 
(peripheren) Datenstromen aus (1104) . Bevorzugt arbeitet' der 
Collector in einer segmentierten MMU-ahnlichen Arbeitsweise, 

is . wobei unterschiedlichen Adressbereiche und/oder Kennungen wie 
- APIDs und/oder lOIDs unterschiedliche Pages zugeordnet sind, 
Bevorzugt kann 1102 durch Pagefaults gesteuert werden, 

Figur 12 zeigt ein Ablaufschema von Datentransf ers fiir unter- 
20- schiedliche Applikationen. Ein Array (PA)' verarbeitet Daten 
entsprechend dem in DE 196 54 846.2 beschiebenen Verfahren 
durch Speicherung von Operanden und Ergebnissen in den Spei- 
chern i202' und 1203. Dem PA sind zusatzlich ein Dateneingabe- 
kanal (1204) und ein Datenausgabekana"U (1205) zugeordnet, 
25 durch die Operanden und/o.der Ergebnisse geladen bzw. gespei- 
chert werden. Die KanSle k5nnen zu externen (Haupt-) Speichern 
und/oder sonstigen (peripheren) Datenstromen- (1208) fuhren. 
pie Kanale konnen aus ihternen FIFO-Stufen und/oder PAE- 
RAMs/PAE-RAM-P.ages und/oder Collectoren/Coilectorpages beste- 
. 30 hen. Die Adressen (CORR-ADR) konnen aktuell durch eine in 

.1201 ablaufende Konf iguration berechnet werden und/oder vor- 
berfechnet sein und/oder durch DMA-Operationen eines (1003) 
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berechnet sein. Insbesondere kann eine Adressberechnung in- 
nerhalb 1201 (CORR-ADR) an einen Collector oder dessen DMA 
gefiihrt werden, urn die Datentransfers des Collectors zu 
adressiefen und zu steuern. Der Dateneingabekanal kann von 
5 einer vofhergehend auf 1201 ausgefUhrten Konfiguration be- 
reits vorgeladen worden sein. 
. Die Kanale arbeiten bevorzugt in einer FIFO-ahnlichen be- 
* triebsweise urn Datentransfers mit 1208 durchzuftlhren. 

10 In dem dargestellten Beispiel wird weiterhin ein Kanal (1207) 
wahrend der beschriebenen Datenverarbeitung innerhalb 1201 , 
der von einer vorherigen Konfiguration oder Applikation ge- 
fallt wurde, an 1208 geschrieben. Dieser Kanal kann ebenfalls 
aus internen FIFO-Stufen und/oder PAE-RAMs/PAE-RAM-Pages 

15 und/oder Collectoren/Collectorpages bestehen. Die Adressen 
konnen aktuell durch eine parallel in 1201 ablaufende Konfi^ 
guration (OADR-CONF) berechnet werden und/oder vorberechnet 
sein und/oder durch DMA-Opera tionen eines (1003) berechnet 
sein. Insbesondere kann eine Adressberechnung innerhalb 1201 

20 (OADR-CONF) an einen Collector oder dessen DMA gefQhrt wer- 
den, um die Datentransfers des Collectors zu adressieren und 
zu steuern. 

Weiterhin werden gleichzeitig Daten fiir eine nachfolgende 
25 Konfiguration. oder Applikation in einen weiteren Kanal gela- 
den (1206) . Auch dieser Kanal kann aus internen FIFO-Stufen 
und/oder PAE-RAMs/PAE-RAM-Pages und/oder Collecto- 
ren/Collectorpages bestehen- Die Adressen konnen aktuell 
durch eine parallel in 1201 ablaufende Konfiguration (lADR- 
. 30- CONF) berechnet werden und/oder vorberechnet sein und/oder 

durch DMA-Operationen eines (1003) berechnet sein. Insbeson- 
dere kann eine Adressberechnung innerhalb 1201 (lADR-CONF) an 
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einen Collector oder dessen DMA gefOhrt werden, um die Daten- 
transfers des Collectors zu adressieren und zu steuern. 
Einzelne Eintrage in den jeweiligen Kanalen kSnnen unter- 
schiedliche Kennungen, z.B. lOIDs und/oder APIDs aufweisen, 
5 um jeweils einer bestimrate Ressource und/oder Speicherstelle 
zugeordnet werden zu k5nnen, 

Figur 13a zeigt eine bevorzugte Implementierung eines BURST- 
FIFOs. 

10 Zuhachst soli die Funktion fiir einen Ausgabe-FIFO der seine 
Werte an einen burst-fahigen Bus (BBUS) tabertragt beschrieben 
werden. Ein erster Zeiger (1301) zeigt auf den aktuell an den 
BBUS auszugebenden Dateneintrag innerhalb eines Speichers 
(1304) - Mit jedem ausgegebenen Datenwort (1302) wird der 1301 

15 um eine Position bewegt. Der Wert des Zeigers 1301 vor Beginn 
des aktuellen Bursttransfers wurde in einem Register (1303) 
gespeichert, Tritt ein Fehler wahrend des Bursttransfers auf, 
wird 1301 mit dem ursprtinglichen Wert aus 1303 neu geladen 
und der Bursttransf er wird neu gestartet. 

20 Ein zweiter Zeiger (1305) zeigt auf die aktuelle Datenein- 

schreibposition im Speicher (1304) fiir einzuschreibende Daten 
(1306) . Um ein Oberschreiben eventuell bei einem Fehler noch 
benotigter Daten zu verhindern, wird der Zeiger 1305 mit dem 
Register 1303 verglichen (1307), um eiJien Vollzustand des 

25 burst-FIFOs anzuzeigen. Der Leerzustand des BURST-FIFOs kann 
durch Vergleich (1308) des Ausgabezeigers (1301.) mit dem Ein- 
schreibzeiger (1305) festgestellt werden. 
Arbeitet das BURST-FIFO fur Einlesedaten von einem 
Bursttransf er, Sndern sich die Fu.nktionen wie folgt: 

30 1301 wird zum Einschreibezeiger fur die Daten 1306. Falls 

fehlerhafte Daten wahrend des Bursttransfers ubertragen wur- 
den, wird die Position vor dem Bursttransfer in 1303 gespei- 
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chert. Tritt ein Fehler wShrend des Bursttransfers auf^ wird 
1301 mit dem urspriinglichen Wert aus 1303 neu geladen und der 
Bursttransfer wird neu gestartet. 

Der Zelger zeigt auf die Ausleseposition des BURST-FIFOs zum 
S Auslesen der Daten (1302) . Urn ein vorzeitiges Auslesen von 
Daten eines hoch nicht korrekt abgeschlossenen Bursttransfers 
zu verhindern^ wird 1305 mit der in 1303 gesicherten Position 
verglichen (1307), urn einen leeren BURST-FIFO anzuzeigen. Ein 
voller BDRST-FIFO wird durch den Vergleich (1308) des Ein- 
10 schreibzeigers 1301 mit dem Auslesezeiger (1305) erkannt. 

Figur 13b zeigt eine mdgliche Implementierung einer Burst- 
Schaltung, die mogliche Bursttransfers erkennt und Boundary- 
grenzen prUft. Die Implementierung ist einfach gehalten und 

15 erkennt lediglich lineare. Adressf olgen. Datentransfers werden 
. grundsatzlich als Bursttransfer gestartet. Bei der ersten 
nicht linearen Adresse wird der Bursttransfer abgebrochen. 
Durch eine Erweiterung einer Lookahead Logik^ die mehrere 
Adre.ssen im voraus priift, lassen sich auch Bursttransfers ei- 

20 ner bestiramten Lange (beispielsweise 4) feststellen und in- 
itialisieren. 

Der Adresswert (1313) eines ersten Zugriffes wird in einem 
Register (1310) gespeichert. Der Adresswert eines darauffol- 
■genden Datentransfers wird mit dem, die Adressdif f erenz 

25 zwischen ersten Datentransfers und dem zweiten Datentransfers 
des Bursttransfers (typischerweise eine Wortbreite) erhohten 
Adresswert (1311) vpn 1310 verglichen (1312). Sind beide Wer- 
te gleich, so ist die Differenz. der ersten Adresse und der. 
zweiten Adresse entsprechend der Adressdif ferenz des 

30 Bursttransfers zwischen zwei Burstadressen, Somit liegt ein 
korrekter Burst vor. Sind die Werte ungleich, mufi der 
Bursttransfer abgebrochen werden. 
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Die jeweils letzte geprflfte Adresse (1313)^ (die zweite Adres- 
se in der Beschreibung) wird jeweils in 1310 gespeichert und 
nachfolgend entsprechend mit der nSchste Adresse (1313) ver- 
glichen. 

5 Zur Feststellung der Einhaltung von Burstgrenzen (Boundaries) 
wird das Adressbit (oder die Adressbits) , an denen die Boun- 
dary liegt des aktuellen Adresswertes (1313) mit deici Adress- 
wert des vorhergehenden Adresswertes (1310) verglichen (z.B. 
XOR 1314) . Sind die Adressbits ungleich wurde Ober die Boun- 
10 dary gesprungen und die Steuerung des Bursts hat entsprechend 
zu reagieren (z.B. 2\bschlufi des Bursttransfers und neues 
Starten) . 

Figur 14 zeigt beispielhaft yerschiedene Methoden, Speicher 
15 i.b. PAE-RAMs zu einem grofterem zusammenhangenden Speicher- 
block zusammenzuschalten- 

Die Figuren 14a-14d verwenden soweit moglich dieselben Refe- 
renzen. 

Die Schreibdaten (1401) warden bevorzugt durch, Pipeline- 
20 Stufen (1402) an die Speicher gefiihrt. Lesedaten (1403) wer- 
den bevorzugt ebenfalls uber Pipelinestuf en; (1404) von den 
Speichern abgefUhrt. Die Pipelinestuf e 1404 beinhaltet einen 
Multiplexer, der den jeweils aktiven Datenpfad weiterleitet . 
Der aktive Datenpfad kann beispielsweise durch das Anliegen 
15 eines RDY. Handshakes erkannt werden. 

Eine Einheit (RangeCheck, 1405) zur Uberwachung der Adressen 
(1406) auf korrekte Werte innerhalb des Adressraumes kann op- 
tional vorgeisehen sein. 

In Figur 14a werden die Adressen iiber Pipelinestuf en (1407a) 
30 an die Speicher ' (1408a) gefUhrt. Die Speicher vegleichen den 
haherwertigen Adressteil mit einer fest vorgegebenen oder 
konfigurierbaren (z.B. durch eine ubergeordnete Konfigurati- 
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onseinheit CT) Referenzadresse, die ftir jeden Speicher ein- 
deutig ist. Bei Gleichheit wird der Speicher selektiert. Der 
niederwertige Adressteil dient der Auswahl der Speicherstelle 

im Speicher. 

5 In Figur 14b weirden die Adressen iiber Pipelinestufen mit in- 
tegriertem Dekrementer (Subtraktion \m 1) (1407b) an die 
Speicher (1408b) gefuhrt. Die Speicher vegleichen den hoher- 
wertigen Adressteil mit dem Wert null. Bei Gleichheit wird 
der Speicher selektiert. Der niederwertige Adressteil dient • 

10 der Auswahl der Speicherstelle im Speicher. 

In Figur 14c werden die Adressen ilber Pipelinestufen (1407c) 
an die Speicher {1408c) gefUhrt. Die Speicher vegleichen den 
hoherwertigen Adressteil mit Referenzadresse, die fur jeden 
Speicher eindeutig ist. Die Referenzadresse wird durch eine 

15 Addierer- oder Subtrahiererkette (1409), die ausgehend von 
einem Startwert (typischerweise 0) fUr jeden Speicher eine 
andere eindeutige Referenzadresse vorgibt. Bei Gleichheit 
wird der Speicher selektiert. Der niederwertige Adressteil 
. dient der Auswahl der Speicherstelle im Speicher. 

20 In Figur 14d werden die Adressen uber Pipelinestufen (1407d) 
an die Speicher (1408d) gefuhrt. Die Speicher vegleichen den 
hoherwertigen Adressteil mit Referenzadresse, die far jeden 
Speicher eindeutig ist. Die Referenzadresse wird durch eine 
in die Speicher integrierte Addierer- ...oder Subtrahiererkette 

25 (1410),. die ausgehend von einem Startwert (typischerweise 0) 
ftir jeden Speicher eine andere eindeutige Referenzadresse 
• vorgibt. Bei Gleichheit wird der Speicher selektiert. Der 
niederwertige Adressteil dient der Auswahl der Speicherstelle 
im Speicher. 

.30 Ftir 1402, 1404, 1407 kann beispielswiese FREGs der PAEs nach 
Figur 5 verwendet werden. Ftir 1409 k5nnen je nach Laufrich- 
tung der Referenza^dresse. FREG oder BREG verwendet werden. 
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Der beschriebene beispielhafte Aufbau hat insbesondere den 
Vorteil/ dass sSmtliche Schreib-ZLesezugriffe dieselbe La- 
tenzzeit aufweisen, da die Adressen und Daten tiber Register- 
5 stufen in den BREG/FREG gefUhrt warden - 

Figur 15 zeigt die Verwendung von GlobalTrack Bussystemen 
(1501, 1502, 1503, 1504) zur Kopplung von Konfigurationen die 
beliebige innerhalb einer Anordung von PAEs (1505) als Konfi- 

10 gurationsmakros (1506, 1507) (siehe auch DE 198 07 872,2, DE 
199 26 538.0, DE 100 28 397.7) konfiguriert wurden. Die Kbn- 
figurationsmakros weisen eigene interne Busverbindungen bei- 
spielsweise tiber interne Basse (0104) auf (1508) . Die Konfi- 
gurationsmakros sind uber 1503 miteinander zum Datenaustausch 

15 verbunden. Ober 1501, 1502 besitzt 1506 Anschluii an Inter- 
face-Baugruppen und/oder lokale Speicher (PAE-RAMs) (1509, 
- 1510) . Ober 1504 besitzt 1507 Anschluli an Interface- 
Baugruppen und/oder lokale Speicher (PAE-RAMs) (1511) . 

20 Beliebige weitere Ausgestaltungen und Kombinationen der er- 
lauterten . Erf indungen sind moglich und einem Fachmann of fen- 
sichtlich. 



I 
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PatentansprUche 

1. Verfahren zum Entkoppeln von Datenstromen bei rekonfigu- 
rierbaren Bausteinen^ dadurch gekennzeichnet^ dafi einer 
Oder mehrere FIFO-Speicher die Baustein internen Daten- 
transfers von den externen Datentransfers entkoppeln. 

2. Verfahren zxm Entkoppeln von Datenstrdmen bei rekonfigu- 
rierbaren Bausteinen, dadurch gekennzeichnet, dafi mehrere 
unabhangige Adressgeneratoren vorgesehen sind. 

3* Verfahren nach Anspruch 2, dadurch gekennzeichnet, dali die 
Adressgeneratoren unabhangig von der Datenverarbeitung 
konfiguriert werden. 

4. Verfahren zum Programmieren von rekonf igurierbaren Bau- 
steinen, dadurch gekennzeichnet, dafi ein Compiler Adress- 
berechnungen in mehrere Konfigurationen zerlegt- 

5. Vorrichtung zur Datenverarbeitung mit einem Feld rekonf i- 
gurierbarer Bausteine und einer Schnittstellenanordnung 
zum Austausch von Daten, insbesondere Daten eines Daten- 
stromes zu verarbeitender Daten, zwischen dem Feld rekon- . 
figurierbarer Bausteine und einer externen Schaltungsan- 
ordnung, dadurch gekennzeichnet, dafi die Schnittstellenan- 
ordnung zumindest einen FIFO-Speicher umfafit, in welchem 
Daten ablegbar sind und aus welchem Daten abgerufen werden 
kSnnen. 

6. Vorrichtung insbesondere nach dem vorhergehenden An- 
spruch, dadurch gekennzeichnet, dafi eine Schaltungsanord- 
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nung vorgesehen ist, vim Daten zu bestimmen, welche in ei- 
ner zuktlnftigen Konfiguration benQtigt werden und diese 
Daten in die Schnittstellenanordnung bzw. einen (iber diese 
schnell ansprQchbaren Speicherbereich vorzuladen. 

7. Vorrichtung insbesondere nach dem vorhergehenden An- 
spruch, dadurch gekennzeichnet, dafi der schnellansprechba- 
re Speicherbereich ein Cache-Speicher, ein externer RAM 
und/oder FIFO-Speicher bzw. ein Register ist. 

8. Vorrichtung insbesondere nach einem der vorhergehenden 
Vorrichtungsanspruche/ dadurch gekennzeichnet, daS ein 
Mittel zum Sichem von in einem Schnittstellenspeicher- 
mittel abgelegten Daten einer zuvor ausgefiihrten ujid zum 
Zeitpunkt des Datenabrufes zumindest partiell nicht mehr 
aktiven, gegebenenfalls durch Umkonf iguration beteiligter 
Feildelemente schon aufgehobenen Konfiguration und/oder 
zur Verhinderung des L6schens und/oder Ubersdhreibens be- 
reits einmal gesendeter, aber noch nicht als -beans tan- 
dungsfrei empfangener bekannter Daten vorgesehen ist. 

9. Vorrichtung insbesondere nach einem der vorhergehenden 
Vorrichtungsanspruche, worin ein von mehreren Feldelemen- 
ten vmd/oder zu Konf igurationen gruppierten Feldelementen 
ansprechbarer Speicher fur wahlweisen Zugriff , insbeson- 
dere RAM-Zellen iind/oder andere Speicherbanke vorgesehen 
sind, um Daten nichtlokai zu speichem und/oder zwischen- 
zuspeichern. 
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(54) Title: METHODS AND DEVICES FOR TREATING AND/OR PROCESSING DATA 

(54) Bezeichnung: VERFAHREN UND VORRICHTUNGEN ZUR DATENBE- UND/ODER VERARBEITUNG 

(57) Abstract: According to the invention, memories are associated with a reconfigurable component (VPU) at the inputs and out- 
puts thereof, so that the internal data processing and paiticularly the reconfiguration cycles can be decoupled from the external data 
streams (to/from periphery, memories etc.). 

(57) Zusammenfassung: Einem rekonfigurieibaren Baustein (VPU) weiden an den EingSngen und/oder AusgSngen Speicher zu- 
geoidnet, urn eine Entkopplung der intemen Datenverarbeitung und i.b. der Rekonfigurationszyklen von den extemen DatenstrSmen 
(zu/von Peripherie, Speichem etc) zu emdchen.' 
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^ (57) Abstract: The invention relates to procedures and methods for administering and transferring data within multi -dimensional 
systems consisting of transmitters and receiveis. The division of a data stream into several independent branches and the subsequent 
combination sequential collection of the individual branches to form a data stream can be carried out in a simple manner. The 
individual data streams are re-combined in a correct time sequence. Said inventive method is particularly useful for processing 

Ore-entrant codes and is suitable for configurable architectures wherein efficient control of the configuration and reconfiguration is 
^ highly important 
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BR. BY, BZ, CA, CH, CN, CO, CR, CU, CZ. DE (Ge- 
biauchsmuster), DE, DK, DM, DZ, EC, EE, ES, FI, GB, 
GD, GE, GH, GM, HR, HU, ID, IL. IN, IS, JP, KE, KG, 
KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV. MA. MD, MG, 
MK, MN. MW, MX, MZ, NO. NZ, OM, PH, PL, FT, RO, 
RU, SD, SE. SG. SI, SK, SL, TJ, TM. TN, TR, TT, TZ, 
UA, UG, US. UZ, VN. YU, ZA, ZM, ZW. 



ES. n. FR, GB, GR, IE, IT. LU, MC, NL. PT. SE, TR), 
OAPI-Patent (BF. B J, CF. CG. CI. CM. GA. GN. GQ, GW. 
ML. MR, NB, SN. TD. TG). 

Erklarung gemaB Kegel 4.17: 

— hinsichilich der Berechtigung des Anmelders, ein Patent zu 
beantragen und zu erhcdten (Regel 4.17 Ziffer U) fur die 
folgenden Bestimmungsstaaten AE, AG, AL, Ah4, AT, AU, 
AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, 
CZ, DE, DK, DM, DZ EC, EE, ES, FI, GB, GD, GE, GH, 
GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, 
LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, 
MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, Si, 
SKSL, TJ, TM, TN, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, 
ZM, ZW, ARIPO'Patent (GH, GM, KE, LS, MW, MZ, SD, 
SL,SZ,TZ, UG, ZM, ZW), eurasisches Patent (AM, AZ, BY, 
KG, KZ, MD, RU, TJ, TM), europiUsches Patent (AT, BE, 
CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, 
PT, SE, TR), OAPI-Patent (BF, BJ, CF, CG, CI, CM, GA, 
GN, GQ, GW, ML, MR, NE, SN, TD, TG) 

VerdfTentUcht: 

— mit intemationalem Recherchenbericht 

(88) VerdfTcntlichungsdatum des intemationalen 

Recherchenberichts: 8. Juli 2004 

(15) Informationen zu Bericlitigungen: 
Fruhere Bericht^ungen: 

siehe PCT Gazette Nr. 44/2003 vom 30. Oktober 2003. 
Section II 

siehe PCT Gazette Nr. 1572003 vom 10. April 2003. Sec- 
tion n 



(84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, 
GM. KE, LS, MW. MZ. SD. SL, SZ, TZ, UG, ZM, ZW), 
eurasisches Patent (AM, AZ, BY, KG. KZ, MD. RU. TJ, 
TM), europaisches Patent (AT, BE. CH, CY, DE. DK. 



Zur Erklarung der Zweibuchstaben-Codes und der anderen Ab- 
kiirzungen wird auf die Erkldrungen ("Guidance Notes on Co- 
des and Abbreviations") am Anfang jeder reguldren Ausgabe der 
PCT -Gazette verwiesen. 



(57) Zusammenfassung: Die Eifindung beschriebt Verfahren und Methoden zur Verwaltung und zum Transfer von Daten innerhalb 
von mehrdimensionalen Anoidnungen von Sendem und Empfangem. Das Aufteilen eines Datenstromes in mehrere unabhSngige 
Zweige und das nachfolgende Zusammenfassen dereinzelnen Zweige zu einem Datenstrom soli einfach durchfiihrbar sein, wobei die 
einzelnen Datenstrome in der konekten zeiUichen Reihenfolge wieder zusanmiengefasst werden. Insbesondere zur Abarbeitung von 
reentrantera Code ist dieses Verfahren von besonderer Wichtigkeit. Das beschriebene Verfahren isl insbesondere fiir konfigurieibare 
Architekturen geeignet, die effiziente Steuerung der Konfiguration und Rekonfiguration findet besondere Beachtung. 



IN^RNATIONAL SEARCH REPORT 



InteniSionel Applleatton No 

PCT/EP 62/82403 



A. CUVSSIHCATiqNOFSyjWECTI^ 

IPC 7 G06F15/8O 






Aooordino to tntefnaflonal Patent ClassSicalion (IPC) or to l)Oth national dassificaiion and IPC 




B. RELD3 SEARCHED 


Mlntmum documentation searched <classiflcaflon system toUowgd by dassHlcatio 

IPC 7 G06F 


n symbols) 




Documentation searched other than minimum documentation to the extent that such documents are Included In the fields searched 


Electronic data base consulted dilHng the tnlernational search (name of data base and, where pracQcalL search tenns used) 


EPO-Intemal, INSREC 






C. OOCUHENTS CONSIDEREirn} BE RBfVANT 


CalBgMy* 


CKaOonol document, wHilndfcallon, where appnipiiate. of As relevant passages 


Relevant to dakn No. 


X 


HONGYU Xi) ET AL: "Parallel QR 
Factorization on a Block Data Flow 
Architecture' 

CONFERENCE PROCEEDINGS ARTICLE, 

1 March 1992 (1992-G3-01) , pages 332-336. 

XPei0285276 

page 333v paragraphs 2.2.2.3,2.4 - page 

334 ■ 


1-5 


A 


US 4 663 706 A (ALLEN JAMES C ET AL) 
5 May 1987 (1987-85-95) 
abstract; figure; 3 


4,5 


X 


US 5 867 723 A (PETERS OR JOSEPH EDWARD 
ET AL) 2. February 1999 (1999-02-02) 
column 28, line 26 - line 34 
column 29, line,21 - line ,32 


1 


1 )(| Fuftherdocuinanls ate Usd to the continual^ 


[X 1 Patent famOymertibers are listed in annex. 


* Spedal categories of cHsd dbeirnranls : 

'A" document defining the genefpi state of the art which is not 
considered to bo of partiaJiarielavanoe 4/ 

'E' eartier document but putiGshed on or afterthe international 
filingdate 

"L* document which may throw doi^ cn priority daim(s) or 
which is cited to establish the pubOcaBon date of another 
cftation or other special reason (as q»cifieid) 

"O" dociment referring to an oral disclosure, use'; exhibition or 
ottier means 

"P* document published prior to the (ntamalionai.'fiBng data but 
l^r than the priority date claimed 


T* later documem pubfished after the intemallonal filing date 
or priority date and not In conflict with the application but 
cited to understand the principle or theory urideitying the 
invention 

"X" document of particular relevance; the claimed Invention 
cannot be considered novel or cannot be oonsideFed to 
irivolve an Inventive step when the document b taken alone 

"V document of partlctJar relevance; the daiined invention 
cannot be considered to Involve an Inventive step when the 
document is combined with one or mora ottier such docu- 
ments, such combination being obvious to a person sMBed 
in the art 

document member of the same patent family 


Data of the aduat oompietian of the intematlbnal search 


Date of mailing of the htemafonal search (Bpoft 


11 September 2603 


051 OZ 2004 




Namoand r 


namng address of the ISA 

European Patent Office, P3. 581B PatenOaan 2 

NL-2280HVROsw5k 

Tel. (+31-70) 340-^)40. Tx. 31 651 epo nl. 

Fax: (+31-70) 340-3016 


Authorized officer 

Michel. T 



Fam PCT4SA/210 (second sheet) (July 1992) 
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IN^NATIONAL SEARCH REPORT I .JiL.Appaca<»..N. 

I PCT/EP 62/92463 



OCContinuation) DOCUfMENTSOOI^niEREDTO BE RELEVANT 


Category' 


atation of document wllh bidlcalloii, where appiDixlats. of the ralevart 




A 


US 6 038 656 A (CUMMINGS URI V ET AL) 

14 March 2668 (2686-63-14) 

column 4, line 5 - line 26; claim 1 


1 



funa PCT/iSAeiO (conUnuaflon of second sheei) (July 1992) 

page 2 of 2 



INTERNATIONAL SEARCH REPORT 



International appfication No. 

PCT/EP 02/92403 



Box I Observations where certain ciaims were found unsearchable (Continuation of item 1 of first sheet) 
ms Intematfonal Search Report has not been established In respect of certain claims under Article 1 7(2)(a) for the foOowIng reasons: 
1. n QataisNos.: 

— because they relate to sub|ect matter not reqUred to be searched by this Authority, namely: 



2. Claims No3.: 

— because they relate to parts of the International Application that do not comply with the prescribed requirements to such 
an extent that no meaninolui IntemaUonal Search can be earned out. specifically: 



3. rn Claims Nos.: 

— because they are dependent claJms end ere not drafted In accordance with the second and third sentences of Rule 6.4(a). 

Box ii Observations where unity of invention is lacking (Continuation of Item 2 of first sheet) 

This International Searchina Authority found multiple inventions in this International application,- as follows: 

see additional sheet 



1 . I I As aH required additional-search fees were timely paid by the applicant, this International Search Report covers all 
' — I searchable claims. 

2. r_] As all searchable claims could be searched without effort justifying an additional fee. tttis Authority did not Invite payment 

of ariy additional fee. 



3. I I As only some of the required addtdonal search fees were timely paid by the applicant, this International Search Report 
« — * covers only those claims for which fees were paid, specifically claims Nos.: 



4. lyj No required additional search fees were timely paid by the applicant Consequently, this International Search Report Is 
restricted to ttie invention first mentioned In the claims; it is covered by ciaims Nos.: ' 

1-5 



Remark on Protest | | The additional search fees were accompanied by the applicant's protest 

j I No protest accompanied the payment of additional search fees. 



Fonn PCT/ISA/210 (continuation of first sheet (1 )) (July 1998) 
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INTEBNATIONAL S£ARCH REPORT 



Intemational q>plicatiQa No. 
PCT/EP 92/02403 



The International Searching Authority has determined that this intemational application 
contains multiple (groups of) inventions, as follows: 

L Clauns: 1-5 

method for controlling pipeline-like data processing operations with alternating 
differing protocols, 

2. Claim: 6 

method for transmitting data from a transmitter to a plurality of transmitters, data 
reception acknowledgement by all transmitters being logically Unked. 

3. Claims: 7-12 

method for transmitting data from a plurality of transmitters to one transmitter in 
an exact sequence. 

4. Clauns: 13-19,24,25 

method for managing data streams, an identification code being associated with 
the data, 

5. Claims: 20-23 

method for partitioning graphs, . 

6. Claims: 26, 27 

data processing process with data processing elements having a FIFO buffer. 

7. Claims: 28-32 

method for resuming the operation of a data word that was previously read or 
written. 



FonnPCT/ISA/210 



IN#1NATI0NAL SEARCH REPORT [-j;H|^ 

bifonnation on patant family members 



Patent document 
cited in search report 



Publication 



ibnal AppCcatlon No 

PCT/EP 02/02403 



Patent family 
m8mb&(&} 



us 4663766 



05-95-1987 



US 
AU 
AU 
BR 
CA 
DE 
DK 
EP 
FI 
6B 
IL 
KR 
NX 
NO 
JP 
JP 
JP 



4667287 A 

560977 B2 
2666383 A 
8395967 A 
1210872 Al 
3380574 01 

490783 A 
G110569 A2 
80975 6 
2133188 
70074 
8862698 Bl 

159163 A 

833922 
1790919 
2022580 
59132253 



A 
A 



.B. 



US 5867723 



02-02-1999 



US 
US 
EP 
OP 
WO 



5581778 A 
5579527 A 
0654158 Al 
7509795 T 
9403852 Al 



US 6938656 



14-03-2060 



US 6381692 Bl 

US 2003140214 Al 
US 6502180 Bl 

US 2002156995 Al 
AU 9485198 A 
GB 2345168 A .B 
WO 9913610 A2 



Publicalion 
date 



19-05-1987 
30-04-1987 
03-05-1984 
05-66-1984 
02-09-1986 
19-10-1989 

29- 04-1984 
13-06-1984 

30- 04-1990 
18-07-1984 

31- 03-1988 
15-10-1988 
26-04-1989 
30-04-1984 

29- 09-1993 
21-05-1990 

30- 07-1984 



03-12-1996 
26-11-1996 
24-05-1995 
26-10-1995 
17-02-1994 



30- 04-2002 
24-07-2003 

31- 12-2002 
24-10-2002 
29-03-1999 
28-06-2000 
18-03-1999 



Form PCT/ISAAIO ftiatant lamfly annex} (Ji^ 1992) 



INTERNATIONA#R RECHERCHENBERICHT 



onaiea Akteozeichen 

PCT/EP 02/92403 



A. KLASSIFIZIERUNQDESANUELOUNGSGEGENSTAimES 

IPK 7 G06F15/8G 



Nach der Intemaiionaten PatsnfldassifB^atton (IPK) oder nach def nafonalen Ktesstfikfltton und der IPK 



a RECHERCHISTTEOEBIETE 



Recheirhiaftar MlndestpittfstofT (Klasstfikailonssystem und KlasslfBcaltonssymbole > 

IPK 7 G06F 



Recherchlefte aber nlcht zurfi MindestprOfstoff gehOrende VoOflentlichungen, soweh diese unterdle recherchlerten Gebiete fallen 



Wahrend der Intemadonalen RecharchQ Konsultierts eleklronlsche Oalenbank (Hame der Datenbank und evfl. venwandeta Suchbegrfffe) 

EPO-Internal, INSPEC . 



C. ALS WESErmJCH ANQESEHENE tWTCTLAGEN 



Kategorle* Bezelchnung der VerOffenllichtjng, sowdl erfonderltdi unter Angabe der In Betracht kommenden Teile 



Betr. Anspruch Nr, 



HONGYU XU ET AL: "Parallel QR 
Factorization on a Block Data Flow 

Architecture" 

CONFERENCE PROCEEDINGS ARTICLE. 

1. Marz 1992 (1992-03-01), Seiten 332-336, 

XP010285276 

Seite 333. Absatze 2.2,2.3.2.4 - Seite 334 



1-5 



ET AL) 



US 4 663 706 A (ALLEN JAMES C 
5. Hai 1987 (1987-05-05) 
Zusaimenfassung; Abblldung 3 

US 5 867 723 A (PETERS JR JOSEPH EDWARD 
ET AL) 2. Februar 1999 (1999-02-02) 
Spalte 28. Zeile 26 - Zeile 34 
Spalte 29, Zeile 21 - Zeile 32 

-/- 



4.5 



SWoltere VortHfGrtlichinigsn sind der Fortsetzuno von F«ld C in 
emnehmen 



Slehe Anhang Patentfamina 



* Besondere Katagorlen von angegebensn Vordffentlichungen : 

"A" VerSffenlfichung, die den aUgemeinen Stand der Technlkdefinfeft 
aber nlcht als besonders bedeutsam anzusehen 1st 

"E* fitteres Dokument das Jedoch erst am oder nach dam Intsmafionalen 
Anmeldedattim vsrOfmntUcht wordan ist 

"L* VerfiffantGchung, de gedgnet tst, einen Prbrit^tsanspruch zweifelhaft er- 
schelnen zu lassen. oder durch die das VertffentUchungsdatuin ekier 
anderen im Recherchenbericht genannten Ver6ffientUchuno belegt waiden 
soD Oder db aus elnem anderen besorvieren Grund angegeben tet (wie 
ausgefOhrt) 

XT VerOflentfldiung. die slch auf elne mOndncha Offenbarung. 

eine Benu^ng, eine Ausetelliing oderanderB Ma^hmen bezioht 
"P" VerdftentUchlnig, did vordem tntematlonalen Anmeidedatum, aber nach 

dem beanqyuchten Pftortiatsdatum verflffenaicht woiden ist 



"T" Spalsre VerSffentfichung. dia nach dem intemationalen Anmeidedatum 
Oder dem Prioritdtsdatum verfiffendlcht worden ist und mit der 
Anmelduno nidit koDidiert sondem nur zum Verstandnis des der 
Erflndung zugrijndefl^enden Prinzlps oder der Dir zugrundeGegenden 
Theorte angegeben Ist 

"X" VerOffentlichung von t^esonderer Bedeutung; die beanspmchte Effmdung 
kann aDein au^grund dlaser VerQffentfichung nlcht als neu oder auf 
errndeitedier T&tigkeit beruhend betrachtet werden 

T* VerOf^tTichung von isesondeier Bedeutung; die beanspruchte Ertmdung 
kann rUcht als auf erfinderfscher T§)igkeit beruhend betrachtet 
werden, wenn die Ver6ffentDchung mh eber oder mehreren anderen 
VerOffentSchungen diesa* Katsgorie in Vertalnduno gebradt wild und 
dlese Vert)(rKhjng Kb* einen Fadrimann rmheliegericmt 

VerSlfentiichung, die Mitgliedderselben Patentfamifie ist 



Datum das AbscHusses der intemationalen Recherche 



11. September" 2093 



Absendedatum dea htematbnalen Recherche nberichts 



osi oz m 



Name und Postanschrift der Intematnnaten Recherchenbeii6rde 
EuropELlsches Patentami, PB. 5818 Patentlaan 2 
NL-2280 HVRijswik 

(+31-70) 340-2040. Tx. 31 651 epo nl, 
Fax: <+31-70) 340-301 6 



BevoOmacht^fter Bedlenstelsr 

Michel, T 



Forniblatt PCTASA/210 (Blatt 2) (JuTi 1992) 
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INTERNATIONA^ RECHERCHENBERICHT 



3 Aktanzolchen 

PCT/EP 02/92403 



a<Fortsemjna) alswesentuchangesehbieumterlagem 



Kateoorto* Bezeichnung der VerOffeniUchung, sowett ertordertlch umer Angabe der In Betracht tommenden Tefle 



Betr. Anspruch Nr. 



US 6 638 656 A (CUMMINGS URI V ET AL] 

14. Marz 20QG (2886-63-14) 

Spalte 4. Zeile 5 - Zeile 26; Anspruch 1 



RimAlau PCT/ISAC10 (Fonsetoiig von Oatl 2) (Jta 
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INTERNATIONALER RECHERCHENBERICHT 



Internationales Aktenzeichen 

PCT/EP 02/02403 



Feld I Bemerlajngen zu den AnsprOchen, did sich als nicht rechercNerbar erwiesen haban (Fortsetzung von Punkt 2 auf Blatt I]) 



Gem&B Artikei 17(2]a) wurde aus folgenden GrQnden tDr bestimmto AnsprOche kein Recheichenbericht erstelit 
1. rn Anspr(teheNr. 

— well sle sich auf Gegenstande bezlehen, zu deren Recherche die BehOrde nlcht verpflichtet 1st, nftmBch 



2. AnsprOche Nr. 

well sie sich auf Telle der Intemattonalen Anmeldung bezlehen. die den vorgeschrlebenen Anforderungen so wenlg entsprechen, 
daB eine shnvolle intemattonale Recherche nicht durchgefQhrt werden kann, ndmllch 



3. I I AnsprOche Nr. 

well es sich dabei urn abhanglge AnsprOche handelt, die nlcht entsprachend Satz 2 und 3 der Rege! 6.4 a) abgefaBt sIrxL 



Feld II Bemerkungen bei mangelnder Einheitllchkelt der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1 ) 



Die intemationale Recherchenbehdrde hal festgestellt, daO diese Internationale Anmefcjung mehrere Eriindungen enthalt: 

siehe Zusatzblatt 

1 . I I Da der Anmelder alte erforderiichen zusatzlichen RecherchengebOhren rechtzeitig entrtehtet hat, erstreckt sich dieser 
I — ' Internationale Recherchent)ertcht auf alle recherchiefbaien AnsprOche. 

2 I I Oa fOr alle recherchlerberen AnsprOche die Recherche ohne einen Arbeitsaufwand durchgefQhrt werden konnte, der eine 
I — I zusStzllche RecherchengebOhr gerechtfertigt hdlte, hat die Behdrde nicht zur Zahlung einer soichen GebOhr aufgefordert. 



3. I Oa der Anmelder nur einige der erfoiderlichen zusStzDchen RecherchengebOhren rechtzeitig entrlchtet hat. erstreckt sich dieser 
' — ' Intemationale Recherchenberteht nur auf die AnsprOche, fOr die GebOhren entrlchtet worden slnd, namtlch auf die 
AnsprOche Nr. 



4. I Y I Der Anmekier hat die erforderltehen zusatzTichen RecherchengebOhren nlcht rechtzeitg entrlchtet Der intemationale Recher- 
chenbericht beschrStnkt sich daher auf die in den AnsprOchen zuerst erwahnta Erfindung; diese ist in folgenden AnsprOchen er- 

faBt: 

. 1-5 



Bemerkungen hinsichtllch eines Widerspruchs Die zusdtzllchen GebOhren wurden vom AnmeMer unter WUerspmch gezahlt. 

I I Die Zahlung zusatziicher RecherchengebOhren erfdgteohneWiderspnJch. 



Fomiblatt PCT/iSA/210 (Fortsetzung von Blatt 1 (1))(Juil 1998) 
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tntamatlonales Aktenzeichen PCT/EP 02 /02463 



WEITEREANGABEN PCT/iSA/ 210 



Die Internationale Recherchenbehorde hat festgestellt, dass diese 
intemationale Anmeldung mehrere (Gruppen von) Erfindungen enthS1t» 
nSmlich: 

1. Anspruche: 1-5 

Verfahren zum Steuem von pipelineartigen 
Datenverarbeitungen nrit abwechselnden unterschiedlichen 
Protokollen. 



2. Anspruch: 6 

Verfahren zum Ubertragen von Daten eines Senders an mehrere 
Sender wobei die Quittierung der Datenabnahme aller Sender 
logisch verknupft wird. 



3. Anspruche: 7-12 

Verfahren zum Ubertragen von Daten mehrerer Senders an einem 
Sender in einer exakten Reihenfolge. 



4. Anspruche: 13-19. 24» 25 

Verfahren zum Verwalten von Datenstromen wobei die Daten 
eine Kennung zugewiesen wird. 



5. Anspruche: 20-23 

Verfahren zum Parti tionieren von Graphen. 



6. Anspruche: 26, 27 

Verfahren zur Verarbeitung von Daten mit 
Datenverarbeitungselementen rait FIFO- Puffer. 



7. Anspruche: 28-32 

Verfahren zum Wiederaufnehmen des Operationsvorgangs eines 
frUher gelesenen/geschriebenen Datenwortes. 
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international|||recherchenbericht 

Af^aben zu VerefienMungen. die zur 88ib8n PatBTi^^ 



Aktenzslchon 



PCT/EP 02/02403 



Im Recherchenbericht 
angefOhrtes Patentdokument 



Datum der 
VerSffenHichung 



Mitgfled(er)der 
PatentfemilGe 



Datum der 
VerSffentnchung 



us 4663766 


A 


05-05-1987 


US 


4667287 A 


19-05-1987 








AU 


568977 B2 


30-84-1987 








AU 


2066383 A 


03-05-1984 








BR 


8385967 A 


05-06-1984 








CA 


1218872 Al 


02-09-1986 








ut 












DK 


490783 A 


29-04-1984 








EP 


G110569 A2 


13-06-1984 








FI 


88975 B 


30-04-1990 








GB 


2133188 A ,B 


18-07-1984 








IL 


78874 A 


31-03-1988 








hR 












NX 


159163 A 


26^04-1989 








NO 


833922 A ,B, 


30-04-1984 








JP 


1798919 C 


29-09-1993 








JP 


2822586 B 


21-05-1990 








JP 


59132263 A 


30-07-1984 


US 5867723 


A 


02-02-1999 


US 


5581778 A 


83-12-1996 






us 


5579527 A 


26-11-1996 








EP. 


0654158 Al 


24-05-1995 








JP 


7509795 T 


26-10-1995 








WO 


9403852 Al 


17-02-1994 


US 6838656 


A 


14-03-2080 


us 


6381692 Bl 


30-04-2002 








us 


2863140214 Al 


24-07-2003 








us 


6582188 Bl 


31-12-2002 








us 


2082156995 Al 


24-10-2082 








AU 


9485198 A 


29-83-1999 








GB 


2345168 A ,B 


28-06-2000 








WO 


9913610 A2 


18-03-1999 
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(57) Abstract: The invention relates to procedures and methods for administering and transferring data within multi-dimensional 
O systems consisting of transmitters and receivers. The division of a data stream into several independent branches and the subsequent 
^ combination sequential coUection of the indWidual branches to form a data stxeam can be canried out in a simple manner. The 

individual data streams are re-combined in a coned time sequence. Said inventive method is paiticnlaily usefiil for processing 

Ore-entrant codes and is suitable for configurable architectures wherein efficient control of the configuration and reconfiguration is 



highly important 
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(57) ZusammenfiBSSung: Die Eifindnng beschriebt Ver&hren nnd Methoden znr Verwaltung und zum Transfer von Daten innerhalb 
von mehidimensionalen Anordnungen von Sendem und Empf^gem. Das Aufteilen eines Datenstromes in mehrere nnabhSngige 
Zweige und das nachfolgende Zasammen&ssen der einzelnen Zwdge zu einem Datenstrom soil einfach durchfbhrbar sein, wobei die 
einzelnen DatenstrSme in der konekten zeitlichen Reihenfolge wieder znsammengefasst werden. Insbesondere zur Abaibeitung von 
reentrantem Code ist dieses Verfahren von besonderer Wichtigkeit. Das beschriebene Veifahren ist insbesondere fUr konfigurierbare 
Architekturen geeignet, die effiziente Steuening der Konfigmation and Rekonfiguration findet besondere Beachtnng. 



